한두 주 전 트위터 피드를 달궜던 흥미로운 이미지 한 건이 있었습니다. 현재까지 출시된 생성 AI의 유형별 목록입니다. 다수가 Open AI의 생성 모델만 기억하고 계시겠지만 다른 선택지들도 많이 있다는 걸 알리는 차원 같았습니다. 블로거 @EtherSiim이 올린 이미지였는데요. 늘 그렇듯, 이미지보다는 택스트로 카피하는 게 가장 편해 보여서 제가 하나하나 일일이 이름을 다시 적어 표에 올려봤습니다. 아직 링크를 걸지는 못했습니다.
이러한 목록을 들여다 보면 멀티모달, 즉 다양한 포맷으로 입력을 받고 다양한 포맷으로 출력을 하는 모델들이 빠른 속도로 증가하고 있다는 것을 확인할 수 있습니다. 어떤 유형이 자신에게 도움이 되는지도 파악해 볼 수 있을 것 같고요.
구분 | 주요 기업들 |
---|---|
Text To Image(T2I) | DALL-E, Stable Diffusion, craiyon, Jasper, Imagen, Midjourney, Nightcafe, GauGan2, Wombo, Wonder, pixray-text2image, neural love |
Text To Video | runway, Fliki, sythesia, Meta AI, Google AI, Phenaki |
Text To Audio | Play.ht, MURF.ai, Resemble.ai, Wellsaid, descript |
Text To Text | Simplified, Jasper, Frase, eluetheai, Requstory, Grammarly, copy.ai, MarketMuse, AI21labs, Hubspot, Inferkit, GooseAI, ResearchAI, Writesonic, Co:here, CHIBI, IdeasAI, copysmith, Flowrite, NICHES$$, sudowrite, ideasbyai, text.cortex, OpenAI GPT-3, Blog idea generator |
Text To Motion | Tree.ind, MDM:Human Motion Diffusion Model |
Text To Code | replit generate code, Github copilot |
Text To NFT | LensAI |
Text To 3D | Dreamfusion, CLIP-mesh, GET3D |
Text To Website | Durable.co |
Audio To Text | descript, AssemblyAI, Whisper |
Audio To Audio | AudioLM, VoiceMod |
Brain To Text | speech from brain, non-invasive brain recording |
Image To Text | neural love, GPT-3 x image captions |