'[AI]/논문 리뷰' 카테고리의 글 목록

[AI]/논문 리뷰 3

논문 출처 : DEEPSEEK최근 가장 핫한 주제는 deepseek라고 생각됩니다. 그래서 논문을 우선 읽어보도록 하겠습니다!!번역/의역 작업을 하면서 틀린 부분이 있을 수 있으니 흐름을 파악하는 용도로만 보시고긴가민가한 부분은 원문을 체크해주세요논문의 순서대로 번역을 진행했으며 가장 하단에 각 부분의 요약을 작성했습니다. 초록 (Abstract)우리는 우리의 첫 번째 세대 추론 모델인 DeepSeek-R1-Zero와 DeepSeek-R1을 소개합니다.DeepSeek-R1-Zero는 감독 학습 기반 미세 조정(SFT, Supervised Fine-Tuning) 없이 대규모 강화 학습(RL, Reinforcement Learning)을 통해 훈련된 모델로, 뛰어난 추론 능력(reasoning capabil..

[AI]/논문 리뷰 2025.02.04

한국어 특화 모델 EXAONE 논문 리뷰

Intro본 글의 목차는 논문의 흐름에 맞추었습니다.논문 : https://arxiv.org/pdf/2408.03541목차1. 초록 (Abstract)2. 서론 (Introduction)3. 모델 학습 (Model Training)4. 성능평가 (Evaluation)5. Responsible AI6. 한계 7.배포 (Depolyment)8.결론 (Conclusion)Abstract LG AI 연구소에서 개발한 대형 언어 모델(LLM) 중 첫 번째 공개 모델인 EXAONE 3.0 인스트럭션 튜닝 언어 모델은 다양한 모델 크기 중에서, 7.8B 인스트럭션 튜닝 모델을 공개하여 연구 및 혁신을 촉진하고자 합니다. 공공 및 내부 벤치마크를 통한 광범위한 평가를 통해 EXAONE 3.0은 유사한 크기의 최신 공개..

[AI]/논문 리뷰 2024.11.17

멀티 에이전트 Magentic-one 논문 리뷰

논문 : https://www.microsoft.com/en-us/research/uploads/prod/2024/11/Magentic-One.pdf 멀티 에이전트 Magentic-ONE1. 소개Magentic-One은 Microsoft Research에서 개발된 복잡한 문제 해결을 위한 다중 에이전트 시스템입니다. 이 연구는 Magentic-One의 일반주의적 접근과 다양한 도메인에서의 적용 가능성을 강조합니다. 본 리뷰에서는 논문의 주요 내용과 성능 평가, 한계와 위험 완화 전략 등을 분석하고, Magentic-One의 발전 가능성을 살펴보겠습니다. Magnetic-One:Magnetic-One은 범용 멀티 에이전트 팀으로, 오픈 소스로 구현되어 있습니다. 이 팀은 Coder, Computer Ter..

[AI]/논문 리뷰 2024.11.15

EunmaStudio

deepseek, 카카오테크부트캠프1기, GPT, 이상감지시스템, KDT, 카테부, human pose estimation, 딥식이, magentic_one, ai, 티스토리챌린지, 네이버부스트코스, exaone, 오블완, 에버엑스, ktb, Agent, 카부캠, 학습계획서, 카카오테크부트캠프,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

EunmaStudio

[AI]/논문 리뷰 3

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역