NLP45 [논문 Review] 25. Scaling Instructable Agents Across Many Simulated Worlds 서로 다른 3D 상용 게임에서 자연어 지시를 수행하는 범용 AI 에이전트Abstract임의의 3D 환경에서 자연어 지시를 따라 행동할 수 있는 embodied AI system을 구축하는 것은 general AI를 만들기 위한 핵심 과제이다.* embodied AI : 인공지능이 물리적 세계와 상호작용 할 수 있도록 통합하는 것을 의미함https://www.nvidia.com/en-us/glossary/embodied-ai/이를 달성하기 위해서는, 복잡한 작업에서 "언어"를 "인지(perception)"와 "행동(embodied actions)"에 연결하는 학습이 필요하다.이번 SIMA 프로젝트에서는 연구용 환경부터 상업용 비디오 게임까지, 다양한 3D 가상환경에서 자유형(free-form) 언어 지시를.. 2025. 11. 25. [논문 Review] 24. ClueCart 게임의 내러티브를 파고들고 싶은 유저를 위한 Creativity Support ToolAbstract최근 게임에서 유행하는 Indexical Storytelling(지시적 스토리텔링) 에 대한 문제를 다룬다.이 방식은 창의적 해석과 팬 커뮤니티의 활발한 토론을 촉진하지만, 단편적이고 비선형적인 단서 구조 때문에 스토리 해석과 조직화가 어렵다는 문제가 있다.이를 해결하기 위해 연구진은 다음 세 가지 단계를 수행했다. 서사 단서의 계층적 분류체계(hierarchical taxonomy) 를 제안하고,이를 기반으로 ClueCart라는 창의적 스토리 해석 지원 도구(Creativity Support Tool, CST)를 설계했으며,Miro를 베이스라인으로 한 40명 규모의 실험을 통해 ClueCart가 단서 조.. 2025. 11. 3. [논문 Review] 23. Generative Agents 25명의 에이전트와 자연어로 상호작용해보자! 꽤나 예전에 나왔던 논문인데, 분량도 꽤 있고 좀 더 꼼꼼하게 읽고 싶어서 정리를 미루고 있었다. 예전에 나왔던 논문인만큼 사용하는 백본 모델도 gpt-3.5로 예전 버전이고, 최근에는 모델 성능도 발전했기 때문에 본 논문에서 제시한 문제점 중 해결이 된 부분들도 많을 것이라 생각한다.하지만 자연어로 상호작용하는, 페르소나를 가진 game agent는 꼭 연구해보고 싶은 분야였기 때문에 근본 논문인 generative agent부터 조사를 진행해보았다.https://arxiv.org/abs/2304.03442 Generative Agents: Interactive Simulacra of Human BehaviorBelievable proxies of human.. 2025. 4. 10. [논문 Review] 22. Evaluating Human-LM Interaction Human - LM Interaction을 평가하기 위한 벤치마크 구축HCI 분야에 관심을 가지게 된만큼 당분간 논문 리뷰는 해당 분야가 올라올 것 같다. 야호!원래는 근본 논문이자 최근에 가장 흥미롭게 읽었던 Generative Agents 논문을 먼저 가져오려고 했으나, 그건 정리가 길어질 것 같아서 우선은 미뤘다. 이 논문을 보게 된 이유도 바로 Generative Agents 논문 때문이다.실험 세팅이나 구성이 매우 흥미로워서 1저자분 블로그를 탐독했더니, 이러한 벤치마크 연구도 하셨더라.https://www.joonsungpark.com/ Joon Sung ParkJoon Sung Park's personal site.www.joonsungpark.com 지난 번 네부캠 프로젝트였던 "찐친이되.. 2025. 3. 6. [논문 Review] 21. Deepseek LLM 각종 최신 기법 & 메모리 절약을 통해 OpenAI 성능을 따라잡자! https://arxiv.org/abs/2401.02954 DeepSeek LLM: Scaling Open-Source Language Models with LongtermismThe rapid development of open-source large language models (LLMs) has been truly remarkable. However, the scaling law described in previous literature presents varying conclusions, which casts a dark cloud over scaling LLMs. We delve into the study of scalarxi.. 2025. 2. 13. GPT Batch API 활용법 (2) - 오류 해결 지난 시간에 이어서 오류가 떴을 때 간단한 해결법을 공유해본다.당연하게도 모든 해결방법을 다루진 않는다또한 지속적인 에러가 발생할 경우 openai status (https://status.openai.com/) 를 먼저 확인하고, status에서 이상이 없을 경우 OpenAI 지원팀에 문의하는게 빠르다공식 Document가 잘되어있어서 참고하는게 좋다 (https://platform.openai.com/docs/guides/batch)우선 페이지 (https://platform.openai.com/batches/) 에 가면 현재 request status를 확인할 수 있다는 것은 저번 포스팅에서 소개했었다. 여기 뜨는 status에는 아래 종류들이 있는데, 간단히 설명하면정상적으로 파일 처리를 할때는 .. 2025. 2. 6. 이전 1 2 3 4 ··· 8 다음