한두 주 전 트위터 피드를 달궜던 흥미로운 이미지 한 건이 있었습니다. 현재까지 출시된 생성 AI의 유형별 목록입니다. 다수가 Open AI의 생성 모델만 기억하고 계시겠지만 다른 선택지들도 많이 있다는 걸 알리는 차원 같았습니다. 블로거 @EtherSiim이 올린 이미지였는데요. 늘 그렇듯, 이미지보다는 택스트로 카피하는 게 가장 편해 보여서 제가 하나하나 일일이 이름을 다시 적어 표에 올려봤습니다. 아직 링크를 걸지는 못했습니다.

이러한 목록을 들여다 보면 멀티모달, 즉 다양한 포맷으로 입력을 받고 다양한 포맷으로 출력을 하는 모델들이 빠른 속도로 증가하고 있다는 것을 확인할 수 있습니다. 어떤 유형이 자신에게 도움이 되는지도 파악해 볼 수 있을 것 같고요.  

구분 주요 기업들
Text To Image(T2I) DALL-E, Stable Diffusion, craiyon, Jasper, Imagen, Midjourney, Nightcafe, GauGan2, Wombo, Wonder, pixray-text2image, neural love
Text To Video runway, Fliki, sythesia, Meta AI, Google AI, Phenaki
Text To Audio Play.ht, MURF.ai, Resemble.ai, Wellsaid, descript
Text To Text Simplified, Jasper, Frase, eluetheai, Requstory, Grammarly, copy.ai, MarketMuse, AI21labs, Hubspot, Inferkit, GooseAI, ResearchAI, Writesonic, Co:here, CHIBI, IdeasAI, copysmith, Flowrite, NICHES$$, sudowrite, ideasbyai, text.cortex, OpenAI GPT-3, Blog idea generator
Text To Motion Tree.ind, MDM:Human Motion Diffusion Model
Text To Code replit generate code, Github copilot
Text To NFT LensAI
Text To 3D Dreamfusion, CLIP-mesh, GET3D
Text To Website Durable.co
Audio To Text descript, AssemblyAI, Whisper
Audio To Audio AudioLM, VoiceMod
Brain To Text speech from brain, non-invasive brain recording
Image To Text neural love, GPT-3 x image captions