為電商網站構建出色的搜索功能絕非易事。搜索功能除了要讓消費者找到高度相關的商品外,更重要的是如何在短時間內為其找到心儀的款式。如果搜索可以做好,賣家商品也就獲得了更多的展示機會,消費者也有了更靠譜的選擇,最終將帶來更多的銷售額。
在Etsy,搜索功能要面臨更大的挑戰。因為平臺的特殊性,該網站的庫存不是可以整齊分類的大規模生產的商品。相反,其200萬商家提供的6000萬件商品中有75%是手工制作的,可以說每件都是獨一無二的。從搜索關鍵字和消費者給出的信息中很難提取出與產品listing相匹配的關鍵字。
Etsy的首席技術官Mike Fisher說:“我們的賣家不會在入庫時輸入‘藍色襯衫’這樣的產品描述。”那樣意味著將標準搜索技術應用于含有海量商品的網站上出現的搜索結果只會具有普遍意義而不能“一擊命中”消費者需求。Fisher舉例說:“如果我們輸入‘包’,它只會向我們展示不盡其數的包(而不會因風格而縮小范圍)。”
Etsy認為,平臺要想提高搜索質量,向消費者展示的商品不僅要符合他們的搜索條件而且要能得出符合他們特定審美偏好的商品。這樣一來,也能夠增加他們在看到搜索結果時,會喜歡他們所看到的東西的幾率。這對買家和賣家來說都是一個福音。但要想這樣做公司需要“教會”它的搜索引擎如何識別風格。
Fisher說,經過大約一年的努力,Etsy已經訓練出了一種機器學習模型,可以根據文本和圖片線索有效地確定網站上符合該風格的商品。該公司即將開始在Etsy上測試這種基于新算法的搜索結果。而且Etsy認為,它所開發的技術的功能給應用程序帶來的益處遠不止是讓搜索更具相關性這么簡單。
表達自我的43種方式
在Etsy的技術專家需要量化風格時,該公司的銷售團隊的工作人員已經花時間了解到了“市場在銷售什么、人們在買什么、平臺上人們在制作什么”這些便于機器學習的基礎信息。該團隊運用這些數據量化了43種不同風格的商品,如“浪漫”、“幾何”、“星際”、“極簡抽象主義”、“熱帶”、“中世紀”、“質樸”和“波西米亞”等。
Etsy賣家甚至曾經還制定了一份包含某一特定風格的13萬條listing列表。這對于他們來說可能尚且可以滿足銷售目的,但是在訓練算法時卻顯得微不足道。以43種風格作為框架,Fisher的團隊從一個月的搜索查詢中收集了300萬個數據點,以供其機器學習模型使用。
使用現成的ML模型(機器學習會在對數據進行訓練后生成一個模型,之后該模型對測試數據進行預測,預測結果為每條數據屬于哪種類別)可以很好地解決許多AI挑戰。但是Etsy目前還沒能這么做。Fisher表示,由于賣家在描述中大多不能準確地傳達產品的風格,因此只掃描文本會產生不盡人意的結果。同樣,標準的圖片識別方法也無法獨立完成工作,因為產品風格不單是由色彩花紋或其他易于算法接收的視覺效果決定的。
Etsy在一個模型中找到了它的解決方案,該模型將文本分析與基于其43種風格的圖片識別方法相結合。例如,算法會將某個繪有鯨魚圖案的藝術品歸入“航海”的主題中,無論該商品listing是否包含該關鍵字。這一功能開辟了將消費者引導到其他航海主題產品的可能性,即使他們與“鯨魚”無關。
(圖源:Etsy)
有一個令人放心的跡象可以表明該算法正確地對產品進行了分類:當Etsy繪制出已識別其樣式的商品銷售圖表時,顯示它們就已經被算法“讀懂”了。被模型識別為“熱帶”的商品在夏季達到其銷售峰值,“浪漫”屬性的商品在情人節和與送禮相關的其他節日期間表現優異。Fisher說:“這讓我們堅信,不僅我們的款式識別準確無誤,而且它們確實引起了消費者的共鳴。”
到目前為止,Etsy在致力于讀懂風格的路上一直在創建、微調和測試其算法。現在該公司已準備將其投入使用。很快它將根據特定用戶執行的最近10次搜索來測試基于風格樣式的搜索結果,即使他們搜索相同的關鍵字,平臺也會為每個人提供一組自定義產品。這只是風格識別算法初始階段直接的作用——改善用戶的產品發現。
除了搜索之外,Etsy還會將算法的機器學習技術應用到網站的其他方面。在測試中,Fisher的團隊對商品給出了自身的“直接式樣評分”,用來體現它們呈現出的特定風格的強度。這么做是符合邏輯的,因為呈現出特定外觀的產品,如星際元素強烈的商品或者天體產品本身,要比那些在風格上打擦邊球或風格不鮮明的產品要賣得更好。這些數據可以用于相關的賣家工具,幫助賣家確定他們是否具有強烈的個人風格,這在琳瑯滿目的手工藝品的修羅場里至關重要。
(編譯/雨果網 謝欣欣)
【特別聲明】未經許可同意,任何個人或組織不得復制、轉載、或以其他方式使用本網站內容。轉載請聯系:editor@cifnews.com