[AI] 8

DeepSeek 알아보기 - 논문 전문 한글 번역

논문 출처 : DEEPSEEK최근 가장 핫한 주제는 deepseek라고 생각됩니다. 그래서 논문을 우선 읽어보도록 하겠습니다!!번역/의역 작업을 하면서 틀린 부분이 있을 수 있으니 흐름을 파악하는 용도로만 보시고긴가민가한 부분은 원문을 체크해주세요논문의 순서대로 번역을 진행했으며 가장 하단에 각 부분의 요약을 작성했습니다. 초록 (Abstract)우리는 우리의 첫 번째 세대 추론 모델인 DeepSeek-R1-Zero와 DeepSeek-R1을 소개합니다.DeepSeek-R1-Zero는 감독 학습 기반 미세 조정(SFT, Supervised Fine-Tuning) 없이 대규모 강화 학습(RL, Reinforcement Learning)을 통해 훈련된 모델로, 뛰어난 추론 능력(reasoning capabil..

[AI]/논문 리뷰 2025.02.04

[MetaCode특강] 비전공자 출신 AI 개발자 전략

우연히 특강 정보를 입수해서 들었습니다!링크 : 메타코드 [12.18/저녁8시] 비전공자 & 석사 없이, AI 개발자 커리어 전환 성공 비결 3가지 metacodes.co.kr대략적인 내용을 정리해봤습니다.1. 핵심 역량 준비 (AI 서비스 개발자, AI 엔지니어)  • 기본 지식 준비 • AI/ML 모델 및 서비스 이해 • 컨테이너, API, DB 활용법 학습 • MLOps 및 파이프라인 구축 흐름 이해 • 백엔드 역량 강화 • Python, RESTful API, SQL과 같은 기본 CS 지식 필요 • 인프라 지식 학습: 클라우드(AWS, Azure), MLOps • 우대 사항 (알면 유리함) • Data Engineering: ETL, 빅데이터 처리 • AI Research: 논문 읽기 및 모델링 ..

[AI]/[AI]일상 2024.12.18

논문 기반 검색 증강 언어 모델 OpenScholar

OpenScholar과학 문헌 검색과 요약의 새로운 길목차 배경 및 소개스팩동작원리사용 방법심화OpenScholar의 탄생 배경 과학 연구는 매년 방대한 양의 논문이 발표되면서 최신 정보를 빠르게 파악하고 활용하는 것이 점점 더 어려워지고 있습니다. 기존의 언어모델(Large Language Model, LLM)은 과학적 정보를 요약하거나 인용하는 데 많은 한계를 보였습니다. 특히, 인용 오류(hallucination)와 최신 논문을 반영하지 못하는 문제는 연구자들에게 실질적인 어려움을 안겨주었습니다. 이를 해결하기 위해 OpenScholar가 등장했습니다. OpenScholar는 검색 증강 언어 모델(Retrieval-Augmented Language Model)을 기반으로, 방대한 과학 문헌 데이터에..

[AI]/모델 2024.11.30

한국어 특화 모델 EXAONE 논문 리뷰

Intro본 글의 목차는 논문의 흐름에 맞추었습니다.논문 : https://arxiv.org/pdf/2408.03541목차1. 초록 (Abstract)2. 서론 (Introduction)3. 모델 학습 (Model Training)4. 성능평가 (Evaluation)5. Responsible AI6. 한계 7.배포 (Depolyment)8.결론 (Conclusion)Abstract LG AI 연구소에서 개발한 대형 언어 모델(LLM) 중 첫 번째 공개 모델인 EXAONE 3.0 인스트럭션 튜닝 언어 모델은 다양한 모델 크기 중에서, 7.8B 인스트럭션 튜닝 모델을 공개하여 연구 및 혁신을 촉진하고자 합니다. 공공 및 내부 벤치마크를 통한 광범위한 평가를 통해 EXAONE 3.0은 유사한 크기의 최신 공개..

[AI]/논문 리뷰 2024.11.17

한국어 자연어 처리 언어 모델 Exaone 소개

목차Exaone 소개Exaone이란 무엇인가?개발 배경 및 목적Exaone의 기술적 특징모델 구조 및 규모한국어 최적화 기술학습 데이터 및 방법론Exaone의 성능 및 비교다른 글로벌 모델과의 성능 비교한국어 자연어 처리에서의 강점Exaone의 실제 활용 사례네이버 서비스에서의 활용 (검색, 쇼핑, 파파고 번역 등)개발자 및 기업의 활용 사례Exaone의 한계와 향후 전망현재의 한계향후 개선 방향 및 발전 가능성1. Exaone 소개Exaone이란 무엇인가?Exaone은 네이버에서 개발한 대규모 AI 언어 모델로, 특히 한국어와 관련된 다양한 자연어 처리(NLP) 작업에 최적화되어 있습니다. GPT-3와 유사한 대규모 언어 모델이지만, 한국어 처리에 있어 뛰어난 성능을 자랑하며, 한국의 데이터와 사용 사..

[AI]/모델 2024.11.16

멀티 에이전트 Magentic-one 논문 리뷰

논문 : https://www.microsoft.com/en-us/research/uploads/prod/2024/11/Magentic-One.pdf 멀티 에이전트 Magentic-ONE1. 소개Magentic-One은 Microsoft Research에서 개발된 복잡한 문제 해결을 위한 다중 에이전트 시스템입니다. 이 연구는 Magentic-One의 일반주의적 접근과 다양한 도메인에서의 적용 가능성을 강조합니다. 본 리뷰에서는 논문의 주요 내용과 성능 평가, 한계와 위험 완화 전략 등을 분석하고, Magentic-One의 발전 가능성을 살펴보겠습니다. Magnetic-One:Magnetic-One은 범용 멀티 에이전트 팀으로, 오픈 소스로 구현되어 있습니다. 이 팀은 Coder, Computer Ter..

[AI]/논문 리뷰 2024.11.15

MS - Magentic-one 다중 에이전트 시스템 마젠틱 원

Magentic-one목차Magentic-One 소개Magentic-One의 비전Magentic-One의 주요 특징다중 에이전트 아키텍처오케스트레이터의 역할Magentic-One의 에이전트들오케스트레이터웹서퍼(WebSurfer)파일서퍼(FileSurfer)코더(Coder)컴퓨터터미널(ComputerTerminal)Magentic-One의 복잡한 작업 해결 방법실제 응용 사례성능 및 평가벤치마크: GAIA, AssistantBench, WebArena결과 및 통찰한계 및 도전 과제현재의 한계위험 완화 전략미래의 가능성과 개선 방향모듈식 확장향상된 학습 능력결론1. Magentic-One 소개Magentic-One은 복잡한 작업을 해결하기 위해 설계된 일반주의 다중 에이전트 시스템입니다. Microsoft ..

OpenAI의 Swarm Framework의 목적과 이해.

SWARMSWARM의 탄생2024년 10월 공개된 다중 에이전트 AI 시스템의 개발 및 관리를 간소화하도록 설계된 새로운 오픈소스 프레임워크.SWARM과 유사 ai 도구의 차이(API, Completions, Custom GPTs, Functions, Assistants)1. 다중 에이전트 협업 * Swarm: 여러 AI 에이전트가 상호 작용하고, 소통하고, 협력하여 문제를 공동으로 해결할 수 있도록 합니다. 각 에이전트는 특정 작업을 전문으로 하여 복잡한 프로젝트를 처리하는 데 있어 효율성과 효과성을 개선할 수 있습니다. * CustomGPTs & API Assistants : 일반적으로 단일 에이전트 상호 작용이 포함되며, 여기서 하나의 모델이 다른 에이전트와 협업하지 않고 입력을 처리하고 출력을..