본문 바로가기

NLP43

[논문 Review] 23. Generative Agents 25명의 에이전트와 자연어로 상호작용해보자! 꽤나 예전에 나왔던 논문인데, 분량도 꽤 있고 좀 더 꼼꼼하게 읽고 싶어서 정리를 미루고 있었다. 예전에 나왔던 논문인만큼 사용하는 백본 모델도 gpt-3.5로 예전 버전이고, 최근에는 모델 성능도 발전했기 때문에 본 논문에서 제시한 문제점 중 해결이 된 부분들도 많을 것이라 생각한다.하지만 자연어로 상호작용하는, 페르소나를 가진 game agent는 꼭 연구해보고 싶은 분야였기 때문에 근본 논문인 generative agent부터 조사를 진행해보았다.https://arxiv.org/abs/2304.03442 Generative Agents: Interactive Simulacra of Human BehaviorBelievable proxies of human.. 2025. 4. 10.
[논문 Review] 22. Evaluating Human-LM Interaction Human - LM Interaction을 평가하기 위한 벤치마크 구축HCI 분야에 관심을 가지게 된만큼 당분간 논문 리뷰는 해당 분야가 올라올 것 같다. 야호!원래는 근본 논문이자 최근에 가장 흥미롭게 읽었던 Generative Agents 논문을 먼저 가져오려고 했으나,  그건 정리가 길어질 것 같아서 우선은 미뤘다. 이 논문을 보게 된 이유도 바로 Generative Agents 논문 때문이다.실험 세팅이나 구성이 매우 흥미로워서 1저자분 블로그를 탐독했더니, 이러한 벤치마크 연구도 하셨더라.https://www.joonsungpark.com/ Joon Sung ParkJoon Sung Park's personal site.www.joonsungpark.com 지난 번 네부캠 프로젝트였던 "찐친이되.. 2025. 3. 6.
[논문 Review] 21. Deepseek LLM 각종 최신 기법 & 메모리 절약을 통해 OpenAI 성능을 따라잡자! https://arxiv.org/abs/2401.02954 DeepSeek LLM: Scaling Open-Source Language Models with LongtermismThe rapid development of open-source large language models (LLMs) has been truly remarkable. However, the scaling law described in previous literature presents varying conclusions, which casts a dark cloud over scaling LLMs. We delve into the study of scalarxi.. 2025. 2. 13.
GPT Batch API 활용법 (2) - 오류 해결 지난 시간에 이어서 오류가 떴을 때 간단한 해결법을 공유해본다.당연하게도 모든 해결방법을 다루진 않는다또한 지속적인 에러가 발생할 경우 openai status (https://status.openai.com/) 를 먼저 확인하고, status에서 이상이 없을 경우 OpenAI 지원팀에 문의하는게 빠르다공식 Document가 잘되어있어서 참고하는게 좋다 (https://platform.openai.com/docs/guides/batch)우선 페이지 (https://platform.openai.com/batches/) 에 가면 현재 request status를 확인할 수 있다는 것은 저번 포스팅에서 소개했었다. 여기 뜨는 status에는 아래 종류들이 있는데, 간단히 설명하면정상적으로 파일 처리를 할때는 .. 2025. 2. 6.
GPT Batch API 활용법 (1) - Batch request 사실 공식 document에 잘 나와있긴 하다. 근데 내가 쓰기 편하려고 모아보려 한다.공식 가이드는 여기 (https://platform.openai.com/docs/guides/batch)실시간 배치 상황 보려면 여기 (https://platform.openai.com/batches) 우선 배치를 쓰는 이유가 뭐냐면, 당연히 싸기 때문이다. 반값이라는 파격적 가격 할인! 물론 audio 처럼 안되는 기능들도 존재하지만...주기적 / 대량의 텍스트 데이터 처리를 할 때 비용 절감을 위해서는 꼭 필요하다. (deepseek api가 안정화되기 전까지는 계속 써야할 듯...) 그럼 이제 GPT 배치 요청 넣고, 받아와서 가공하는 법까지 알아보겠다. 1. Batch JSONL 만들기현재 api를 batch로.. 2025. 2. 6.
좋은 프로젝트란 무엇인가? - 기획편 취준을 하면서, 이번에는 욕심을 내서 여러 프로젝트에 참여하게 되었다. 특히 프로젝트 2개는 초기 단계 멤버로 시작하여 기획이나 UI/UX 쪽도 건드려볼 기회가 생겼는데,평소에 내가 하던 업무와 달라서 기대가 되기도 하고, 알아야 할 것도 많을 것 같아서 이참에 정리를 해보려고 한다.또한 앞으로 계속 AI 프로덕트 개발에 참여하려면 기획적인 측면도 잘 고려해야 훌륭한 개발자로 성장할 수 있을 것이라 생각한다. 이쪽은 전문적으로 공부한 분야는 아니기에, 웹 서치 + 프로젝트 진행할 때 PM 분들과 협업하며 배운 것들을 위주로 서술해보려고 한다. 좋은 프로젝트가 나오기 위해서맨 처음 프로젝트를 시작할 때에는 우선 기획을 잡고, 프로젝트 전체의 진행 계획을 수립하는 것이 중요할 것이다.일반적인 개발 프로젝트가.. 2025. 1. 16.