NLP/프로젝트7 How to Build domain-specific Embedding model - (1) : 선행 연구 조사 도메인에 특화된 임베딩 모델을 만들기 위해서는 어떻게 데이터셋을 구축하고 학습을 진행해야 하는지, 선행 연구를 통하여 알아보도록 한다.도메인 특화 임베딩 모델 구축의 의미상용 도메인 특화 모델은 내부 데이터를 공개하지 않음현재의 LLM은 복잡한 도메인 용어가 있을 경우 제대로 작동하지 않음→ 모델 학습에 해당하는 데이터가 부족하기 때문인터넷 데이터가 풍부하더라도 교육 튜닝이나 임베딩 학습에 적합한 형태로 데이터를 얻는 것이 어려움 LLM2Vechttps://ll2ll.tistory.com/69 [논문 Review] 12. LLM2Vec : Large language models are secretly powerful text encoders논문의 핵심 내용 한줄 요약LLM을 text encoder로 이.. 2024. 12. 4. 이전 1 2 다음