올리브영, 언어 모델 기반 상품 추천 시스템 개선으로 사용자 경험 혁신
🤖 AI 추천
이 콘텐츠는 추천 시스템 개발자, 데이터 과학자, 머신러닝 엔지니어, 그리고 커머스 플랫폼의 AI 기술 도입 및 성능 개선에 관심 있는 IT 기획자들에게 매우 유용합니다. 특히, 자연어 처리(NLP) 기술을 활용한 상품 유사도 측정 및 추천 모델링 경험을 쌓고 싶은 개발자들에게 실질적인 인사이트를 제공합니다.
🔖 주요 키워드

핵심 기술: 올리브영은 상품 구매 요인과 직결된 방대한 속성·성분 데이터를 기반으로, 사용자의 구매 패턴 및 니즈를 정교하게 파악하여 맞춤형 상품 추천을 제공합니다. 특히, 유사 상품 추천을 위해 Item × Item
모델링 방식에서 발생하는 속성 가중치 불균형 문제를 해결하고자 언어 모델(Language Model)을 활용한 새로운 접근 방식을 도입했습니다.
기술적 세부사항:
* 기존 방식의 한계: One-hot encoding과 Cosine Similarity를 사용한 속성 기반 유사도 계산 시, 중요도가 낮은 속성까지 과도하게 반영되어 실제 관련 없는 상품 간 유사도가 과대평가되는 문제 발생.
* 새로운 접근 방식:
* 언어 모델 활용: 상품의 텍스트 기반 속성 및 정보를 이해하고 의미론적 유사도를 파악하기 위해 Sentence Transformer 구조를 채택했습니다.
* Loss Function: MultipleNegativesRankingLoss
를 사용하여 '유사 관계' 데이터만으로 '비유사 관계'를 암시적으로 샘플링하여 학습 효율성을 높였습니다.
* 데이터 구축: 사용자의 검색 행동 로그를 분석하여, 동일한 검색어로 클릭된 상품들을 유사하다
는 레이블로 활용했습니다. 이는 사용자의 실제 비교 관점을 반영하여 모델 학습의 정확도를 높이는 데 기여했습니다.
* 콜드 스타트 대비: 속성 정보가 부족하거나 없는 신규 상품을 위해, 기존의 유사 상품 쌍에서 무작위로 속성 정보를 제거하여 학습 데이터를 보강하는 방식을 사용했습니다.
* 정량적 검증: 모델의 집중 영역(Attention) 분석을 통해 카테고리별 속성 중요도 학습 여부를 검증했습니다. 동일 카테고리 내에서는 유사한 속성에 집중하고, 다른 카테고리 간에는 다른 속성에 집중하는 것을 확인하여 모델의 학습 효과를 입증했습니다.
개발 임팩트:
* 기존 모델 대비 CTR(Click-Through Rate) 약 50% 개선을 달성하며 실질적인 비즈니스 성과를 창출했습니다.
* 상품 속성 유무에 관계없이 추천 커버리지를 100%로 확대했습니다.
* 카테고리별 상품 특성에 따른 가중치 적용으로 더욱 정교하고 개인화된 추천 경험을 제공합니다.
* 향후 모델 확장성과 AI 플랫폼의 경쟁력 강화를 위한 중요한 기반을 마련했습니다.
커뮤니티 반응: 원문 내용만으로는 특정 커뮤니티의 직접적인 반응을 파악하기 어렵습니다. 하지만 언급된 기술 스택과 문제 해결 방식은 데이터 과학 및 머신러닝 커뮤니티에서 활발히 논의되는 주제입니다.
톤앤매너: 본 글은 데이터 기반의 문제 해결 과정과 기술적인 접근 방식을 상세하게 설명하며, 전문적이고 정보 전달에 충실한 톤을 유지하고 있습니다. 데이터 과학자와 머신러닝 엔지니어에게 실질적인 도움이 될 수 있는 깊이 있는 내용을 다루고 있습니다.