1.理解數據並使用分層抽樣。
數據是決定全流程策略的核心。圖像質量可能會帶來復雜性,需要小心處理。在視覺搜索時,了解目錄中的圖片和用戶上傳的圖片是非常重要的。
2.數據增強是關鍵,尤其是圖像旋轉。
當訓練數據不能包含真實場景中所有可能的變化時,數據擴展是訓練神經網絡的關鍵步驟。當用戶使用移動電話拍攝對象時,圖像很可能會被裁剪、旋轉、模糊或沒有縮放到適當的大小。
3.提取語義簽名時盡可能使用監督信息。
如上所述,盡可能使用監督信息是非常重要的。這有助於訓練分類器關註信息內容,忽略其他非信息區域。
4.簽名的熵分析
這壹步通常被大型信息檢索系統的系統設計所忽略。評估給定的簽名容量中是否包含足夠的有效信息是非常重要的。
5.當標簽是粗粒度標簽時,類內方差非常重要。
我們使用粗粒度的葉子類別標簽代替產品ID來訓練神經網絡。部分原因是雖然葉子類別是粗粒度的,但是更容易獲得。
6.用排除法提高搜索速度和精度。
專門為高速和高精度設計的排除法具有強大的能力。例如,如果輸入圖像包含運動鞋,則無需搜索裙子、桌子和電腦的庫存。