產品分類/產品分類是將產品組織到各自的部門或類別中。這個過程的很大一部分是整個產品分類的設計。
產品分類最初是一個文本分類任務,它分析產品的標題以選擇適當的類別。但是,已經開發了許多方法,這些方法考慮到了產品標題、描述、圖像和其他可用的元數據。
以下關于產品分類的論文代表了該領域的基本閱讀,為產品分類任務提供了新穎的方法。

1. 不分類,翻譯

本文由新加坡國立大學和樂天理工學院的研究人員提出并解釋了一種新穎的機器翻譯方法,以進行產品分類。該實驗使用樂天數據挑戰和樂天一巴數據集。
他們的方法將產品的描述轉換或轉換為一系列令牌,這些令牌表示到正確類別的根到葉路徑。使用此方法,它們還能夠在分類中提出有意義的新路徑。
研究人員指出,他們的方法優于當今機器學習中常用的許多現有分類算法。
  • 發布時間/上次更新時間 ? 12 月

org/pdf/1812.05774v1.pdf”標題\”https://arxiv.org/pdf/1812.05774v1.pdf”>閱讀現在]

2. 使用神經注意模型對日本產品名稱進行大規模分類

本文作者對基線卷積神經網絡(CNN)模型和梯度增壓樹(GBT)分類器提出了關注卷積神經網絡(ACNN)模型。
該研究使用從樂天一葉(RakutenIchiba)取取的日本產品標題作為培訓數據。利用這些數據,作者比較了三種方法(ACNN、CNN 和 GBT)在大規模產品分類中的性能。
雖然不準確的差異可能小于 5%,但準確性的輕微改進也可能導致數百萬個額外的正確分類。
最后,作者解釋了 ACNN 和 GBT 模型組合如何進一步減少錯誤分類。

  • 發布/最后更新 – 2017 年 4 月,EACL 2017
  • 作者和貢獻者 – 來自樂天理工學院:夏燕迪、亞倫·萊文、普拉迪普托·達斯·朱塞佩·迪·法布里齊奧、慶吉·辛扎托和安庫爾·達塔

3

在這篇論文中,該團隊展示了其數據集,其中包括超過 186,000 張服裝產品圖片及其產品標題。

此外,他們還介紹了影響他們學習的領域的相關工作。最后,他們使用 Resnet34 分類模型和 Seq 到 Seq 模型測試其數據集,以對產品進行分類。
這些數據取自印度電子商務商店,因此使用一些類別可能不適用于西方市場。但是,數據集是開源的,可在 Github 上找到。
  • 發布時間/上次更新時間 ? 2019年8月19日
  • 作者和貢獻者 – 文卡泰什·烏馬尚卡爾(愛立信研究)、吉里什·尚穆加姆(愛立信研究)和阿迪提·普拉卡什(科羅拉多大學)

4. 使用結構化和非結構化屬性進行大規模產品分類

在這項研究中,WalmartLabs 的一個團隊將分層模型與平面模型進行產品分類。
研究人員采用基于深度學習的模型,從每個產品中提取特征來創建產品簽名。在論文中,研究人員描述了一種基于多LSTM和多CNN的方法,以完成這一極端的分類任務。此外,它們提出了一種使用結構化屬性的新方法
  • 發布時間/上次更新時間 ? 2019年3月1日
  • 作者和貢獻者 – 來自沃爾瑪實驗室: 阿比南丹 · 克里希南和阿比拉什 · 阿馬塔魯里

5. 多標簽產品分類使用多模式融合模型

在這篇論文中,來自紐約大學和美國銀行的研究人員研究了在亞馬遜上對產品進行分類的多模式方法。
他們的方法使用多個分類器,這些分類器對產品列表中的每種類型的輸入數據進行了培訓。他們使用包含 940 萬個 Amazon 產品的數據集,開發了基于產品圖像、標題和描述的產品分類三模式模型。他們的三模晚融合模型保留了88.2%的F1分。

他們的研究結果表明,增加模式的數量可以提高多標簽產品分類的性能。
  • 發布時間/上次更新時間 – 2019年6月30日
  • 作者和貢獻者 – 帕薩韋·維羅伊瓦塔納庫爾(紐約大學)和阿蒂特·旺佩拉旺(美國

銀行)

在上面關于產品分類的論文中,研究人員對包括數百萬個產品的開放式數據集進行了模型培訓。但是,如果您正在構建用于商業用途的產品分類模型,則這些數據集將不可用。
Comments are closed.