IT/New Tech 3

멀티 에이전트 시스템- SWARM

llm을 활용할 수 있는 새로운 프레임 워크 openAI의 SWARM이 공개되었는데 공개된지 한 달이 되지 않았는데 많은 사람들이 관심을 가지고 있습니다.  SWARM의 주요 특징1. 자율성각 개체가 독립적으로 행동하며, 서로 간에 상호작용을 통해 전체 시스템의 목표를 달성합니다.마치 회사에서 하나의 목표를 위해 각자의 역할을 수행하는 모습과 같습니다. 2. 확장성개체 수가 늘어나더라도 시스템이 원활하게 작동할 수 있음. 3. 강건성일부 개체가 고장 나더라도 전체 시스템에 큰 영향을 주지 않고 계속 작동이 가능함. 4. 핸드오프에이전트가 자신이 맡은 작업을 마치면, 다음 단ㄱ계의 작업을 다른 에이전트에게 작업을 넘김 5. 컨텍스트 변수에이전트 간 정보를 공유하기 위한 변수로, 작업중에 갱신되어 여러 에이..

IT/New Tech 2024.10.21

F5 TTS 사용법

TTS란?Text To Speech의 줄임말이며 컴퓨터의 프로그램을 통해 사람의 목소리를 구현해 내는 것으로, 성우 없이도 단어와 문장의 음성을 쉽게 소리 내는 것이 특징인 기술. 일반적으로 TTS는 다음과 같은 과정을 거칩니다.1. 텍스트 전처리  텍스트를 받아 문장 구조와 발음 기호(phonemes)로 변환하는 과정. 이를 통해 기계가 텍스트를 음성 신호로 바꿀 수 있도록 함2. 음소변환텍스트의 각 부분을 음소로 변환하여 해당 소리로 변환할 수 있도록 준비. 이 단계에서 문장 구조, 억양, 강세 등이 고려됨3. 음성합성 음소를 실제 음성 신호로 합성하는 단계. 주로 다음 두 방식이 사용된다.파형 기반 합성 : 미리 녹음된 음성 조각을 조합하여 음성을 생성하는 방식신경망 기반 합성 : 딥러닝 모델을 사..

IT/New Tech 2024.10.16

Llama 3.2 모델 출시

오픈소스 LLM모델로 유명한 Llama 시리즈가 몇 달 전 3.1을 출시했는데 더욱 가벼워진 3.2로 돌아왔습니다.3.2 모델은 경량화된 1B, 3B 모델을 포함하여 개인 사용자의 접근성을 넓혔습니다. 11B, 90B 모델은 멀티모달에 특화되어있지만 본 포스팅에서는 경량화된 1B, 3B의 이야기만 다룹니다. 멀티모달에 관심있으신 분은 사진을 클릭해서 내용을 확인하세요   Download models를 누르면 이러한 화면이 나타나는데, 내용을 모두 입력하면 심사를 거친 뒤 48시간 동안 사용가능한 코드를 발급받게 됩니다.이후 과정은 간단합니다. 신청을 하면 자세히 알려주는데 대략의 순서는 다음과 같습니다. 1. Llama stack 설치2. 원하는 버전 선택3. 발급받은 키 입력 위 과정을 거치면 사용자 ..

IT/New Tech 2024.10.15