AI Directory
The most curated list of AI tools updated daily. Filter by category to find your next productivity booster.
Cursor
AI CodingCursor는 현존하는 가장 진보된 형태의 AI 네이티브 코드 에디터입니다. 기존의 VS Code를 포크(Fork)하여 제작되었기 때문에 기존 환경의 단축키, 테마, 확장 프로그램을 100% 호환하면서도 에디터 내부 깊숙한 곳까지 생성형 AI가 통합되어 있습니다. 가장 강력한 기능인 'Cmd+K'는 선택한 코드 블록을 프롬프트 기반으로 즉각 리팩토링하거나 새로운 로직을 작성하게 해주며, 'Cmd+L'을 통한 사이드바 채팅 기능은 단순한 질의응답을 넘어 현재 작업 중인 코드의 전체 컨텍스트(코드베이스 인덱싱)를 이해한 상태에서 버그를 디버깅하거나 구조적 아키텍처에 대한 조언을 제공합니다. 최근 도입된 Claude 3.5 Sonnet 모델과 GPT-4o의 조합을 통해 엔지니어는 공식 문서를 찾아보는 시간을 90% 이상 절약할 수 있습니다. 특히 복잡한 정규식 작성, 보일러플레이트 코드 생성, 테스트 코드 자동화 등에서 타의 추종을 불허하는 생산성을 자랑합니다. 다만 프로젝트의 규모가 방대해질수록 AI가 전체 파일 구조의 의존성을 완벽하게 매핑하는 데 한계를 보일 때가 있으며, 보안이 매우 중요한 엔터프라이즈 환경에서는 로컬 코드가 외부 API로 전송된다는 점에서 Privacy 모드 활성화 등 세심한 설정 관리가 요구됩니다.
GitHub Copilot
AI CodingGitHub Copilot은 마이크로소프트와 OpenAI의 협력으로 탄생한 세계 1위의 엔터프라이즈 AI 코딩 어시스턴트입니다. 개발자가 코드를 타이핑하는 순간, 주석과 이전 로직을 실시간으로 분석하여 다음 줄이나 함수 전체의 코드를 회색 텍스트(고스트 텍스트)로 자동 제안합니다. 수십억 줄의 오픈소스 코드를 학습한 OpenAI의 Codex 모델을 기반으로 작동하며, 파이썬, 자바스크립트, 타입스크립트는 물론 Go, Rust 등 수많은 프로그래밍 언어 생태계에 대한 방대한 지식을 갖추고 있습니다. 최신 업데이트된 'Copilot Chat' 기능을 통해 에디터 내에서 대화형으로 코드를 설명받거나 리팩토링을 지시할 수 있으며, GitHub Enterprise 환경과 긴밀하게 연동되어 팀 단위의 코드 리뷰, 풀 리퀘스트(PR) 요약 생성 등 DevSecOps 워크플로우 전반에 걸친 효율성을 제공합니다. 가장 큰 강점은 어떠한 IDE(Visual Studio, JetBrains, Neovim 등)에서도 플러그인 형태로 안정적으로 동작한다는 점입니다. 하지만, 가끔 최신 라이브러리의 변경된 API나 Deprecated된 구문을 제안하는 환각 현상이 발생할 수 있어 시니어 개발자의 꼼꼼한 코드 검수(Code Review)가 필수적으로 동반되어야 합니다.
v0.dev
AI Codingv0.dev는 Next.js 프레임워크의 개발사인 Vercel에서 직접 만든 생성형 AI 프론트엔드 UI/UX 도구입니다. 프론트엔드 개발의 판도를 바꾸고 있는 이 툴은, 사용자가 원하는 인터페이스의 모습이나 레이아웃을 자연어로 입력하면 즉시 최신 웹 트렌드에 부합하는 React 컴포넌트와 Tailwind CSS 코드를 결합하여 시각적으로 완벽한 결과물을 렌더링해 냅니다. 내부적으로 유명한 오픈소스 컴포넌트 라이브러리인 shadcn/ui의 디자인 시스템을 기반으로 동작하기 때문에 생성된 코드가 단순히 화면에만 잘 보이는 스파게티 코드가 아니라, 실제 프로덕션 환경에 바로 복사-붙여넣기(Copy-Paste)하여 사용할 수 있을 정도로 깔끔하고 유지보수가 용이합니다. 기획자나 디자이너가 초기 프로토타입을 제작하거나, 프론트엔드 개발자가 지루한 레이아웃 잡기 작업을 건너뛰고 핵심 비즈니스 로직에만 집중하고 싶을 때 혁명적인 시간 단축을 가져옵니다. 단점은 아직 React 생태계와 Tailwind에 지나치게 종속적이며, 복잡한 상태 관리(State Management)나 백엔드 API 연동과 같은 동적인 로직 생성에는 관여하지 못한다는 명확한 한계가 존재한다는 것입니다.
Claude 3.5 Sonnet
AI CodingClaude 3.5 Sonnet은 Anthropic이 선보인 중형급 AI 모델로, 코딩 및 논리적 추론 분야에서 GPT-4o를 뛰어넘는 벤치마크 결과를 보여주며 개발자 커뮤니티의 전폭적인 지지를 받고 있습니다. 이 모델의 가장 독보적인 장점은 방대한 컨텍스트 윈도우(200K 토큰)를 활용한 '전체 프로젝트 단위의 구조적 이해력'입니다. 수백 개의 파일로 이루어진 거대한 레거시 시스템의 코드를 그대로 복사해서 붙여넣고 리팩토링이나 디버깅을 지시하면, 변수들의 의존성을 잃지 않고 매우 정교하게 얽힌 문제의 원인을 짚어냅니다. 또한 새롭게 도입된 'Artifacts(아티팩트)' 기능을 통해 생성된 코드를 채팅창 옆의 독립된 뷰어에서 실시간으로 렌더링하여 작동하는 웹 앱, 다이어그램, 게임 형태로 즉시 확인할 수 있습니다. 이는 코드의 시각적 디버깅 속도를 비약적으로 상승시킵니다. 단점으로는 Anthropic의 생태계가 OpenAI만큼 방대하지 않아 외부 써드파티 앱(플러그인) 연동이 부족하고, API 사용 시 토큰 비용이 타 경량 모델 대비 다소 부담될 수 있다는 점이 있습니다.
Sora
AI VideoSora는 OpenAI에서 개발 중인 텍스트-투-비디오(Text-to-Video) 모델의 끝판왕으로 불리며 영상 생성 AI 산업에 지각 변동을 일으킨 혁신적인 플랫폼입니다. 기존의 생성형 비디오 도구들이 3~4초 남짓의 짧고 뭉개지는 퀄리티의 영상을 만들어냈던 것과 달리, Sora는 단 한 줄의 텍스트 프롬프트만으로 최대 60초 분량의 매끄럽고 고해상도(1080p 이상)인 숏폼 비디오를 단숨에 생성해 냅니다. 이 모델의 진정한 혁신은 단순히 이미지를 이어붙이는 수준을 넘어, 현실 세계의 3D 공간과 물리 법칙(Physics)을 본질적으로 시뮬레이션한다는 점입니다. 물에 반사되는 빛의 굴절, 천의 섬세한 펄럭임, 눈길을 걷는 발자국의 패임 등 매우 복잡한 상호작용을 사실적으로 묘사합니다. 이는 영화 제작 전의 스토리보드 시각화, 고비용 스톡 푸티지 대체 등에서 압도적인 파급력을 가집니다. 단점은 아직 베타 단계로서 일부 유리의 깨짐 현상이나 중력이 거꾸로 작용하는 등 복잡한 물리 엔진 오류가 종종 발생하며, 언제 일반 대중에게 상용화될지 정확한 일정과 렌더링 단가(비용)가 베일에 싸여 있다는 것입니다.
Runway Gen-3 Alpha
AI VideoRunway Gen-3 Alpha는 할리우드 영화 제작자 및 전문 VFX 아티스트들을 겨냥하여 출시된 하이엔드 비디오 생성 모델입니다. Sora가 현실 세계의 물리 법칙 시뮬레이션에 강하다면, Runway Gen-3는 영화적인 연출, 극적인 조명, 섬세한 텍스처와 감정 표현 등 '시네마틱 퀄리티'에 모든 역량을 집중한 느낌을 줍니다. 사용자는 텍스트 프롬프트는 물론 특정 이미지를 업로드하여(Image-to-Video) 그 이미지에 생명을 불어넣을 수 있습니다. 특히 Runway만의 독보적인 기능인 'Motion Brush(모션 브러시)'와 고급 카메라 제어(Camera Controls)를 활용하면, 영상 속 폭포수가 떨어지는 속도, 인물의 머리카락이 날리는 방향, 드론이 줌인하는 각도 등을 픽셀 단위로 정확하게 통제할 수 있습니다. 이는 AI 영상의 가장 큰 취약점이었던 '통제 불가능성'을 완벽하게 극복한 사례입니다. 단점은 고화질의 렌더링 결과물을 얻기 위해 크레딧 소모가 매우 빠르며, 복잡한 인체의 관절 움직임이나 손가락 묘사에서는 여전히 일그러짐(Morphing) 현상이 종종 발생한다는 것입니다.
Luma Dream Machine
AI VideoLuma Dream Machine은 누구나 웹 브라우저에서 즉시 고품질 비디오를 생성할 수 있도록 진입 장벽을 대폭 낮춘, 생성형 비디오 시장의 다크호스입니다. Luma AI의 독자적인 3D 렌더링 기술을 바탕으로 개발된 이 모델은 특히 빠른 렌더링 속도와 극적인 카메라 무빙 연출에 큰 강점을 보입니다. 사용자가 텍스트 프롬프트를 입력하면 약 2분 이내에 5초 분량의 고화질 비디오를 쏟아내며, 밈(Meme) 제작, SNS 숏폼용 임팩트 있는 클립, 일러스트의 애니메이션화 등에 전 세계적으로 폭발적인 인기를 끌고 있습니다. 프롬프트에 'FPV 드론 샷', '시네마틱 팬(Pan)' 등의 키워드를 넣었을 때 공간의 깊이감과 투시를 이해하고 역동적인 영상을 뽑아내는 능력이 탁월합니다. 다만, 영상의 지속 시간이 상대적으로 짧고(기본 5초), 배경과 전경의 분리에서 간혹 오브젝트가 녹아내리거나 융합되는(Blending) 현상이 발생하여 디테일한 상업용 영화 소스로 쓰기에는 아직 아쉬움이 있습니다. 하지만 가성비와 접근성 면에서는 현재 최고의 툴입니다.
Kling AI
AI VideoKling AI는 중국의 콰이쇼우(Kuaishou)에서 개발하여 전 세계에 놀라움을 안겨준 비디오 생성 AI 모델입니다. 서구권 모델인 Sora나 Runway에 대항하기 위해 출시된 이 모델은 특유의 방대한 데이터 학습량을 바탕으로 매우 현실적이고 복잡한 일상 생활의 디테일 묘사에 소름 돋는 성능을 발휘합니다. 사람들의 미세한 근육 움직임, 음식을 먹는 장면의 자연스러운 물리적 변화, 옷의 질감 표현 등에서 경쟁사들을 압도하는 퀄리티를 종종 보여주며 숏폼 크리에이터들의 필수 도구로 급부상했습니다. 특히 프롬프트를 통해 지시한 캐릭터의 행동이 프레임 중간에 끊기거나 변형되지 않고 끝까지 유지되는 '시간적 일관성(Temporal Consistency)'이 매우 훌륭합니다. 하지만 중국 서비스라는 특성상 서양인이나 글로벌 특정 문화를 묘사할 때 데이터 편향으로 인해 부자연스러운 결과가 나올 때가 있으며, 인터페이스나 서비스 안정성 측면에서 아직 글로벌 스탠다드에 완벽하게 부합하지는 못한다는 단점이 존재합니다.
Midjourney
AI ImageMidjourney는 현재 생성형 AI 이미지 시장에서 '예술적 퀄리티'의 절대적인 기준점 역할을 하고 있는 텍스트-투-이미지 플랫폼입니다. DALL-E 3나 다른 도구들이 사용자의 프롬프트를 있는 그대로 정직하게(가끔은 밋밋하게) 그려낸다면, Midjourney는 자체적인 고유의 미학 알고리즘을 추가하여 어떠한 키워드를 입력하더라도 사진작가나 전문 일러스트레이터가 작업한 것 같은 압도적인 분위기와 질감을 부여합니다. V6 버전에 이르러서는 고질적인 약점이었던 텍스트 렌더링 기능이 대폭 개선되었으며, 세밀한 피부 땀구멍, 가죽의 질감, 복잡한 실사 사진의 광원 효과까지 완벽하게 재현해 냅니다. 특히 'Style Reference' 기능을 통해 사용자가 제공한 레퍼런스 이미지의 화풍과 분위기를 완벽하게 모방하여 여러 이미지에 일관된 스타일을 입히는 데 탁월합니다. 다만, 별도의 독자적인 웹사이트나 앱이 없이 게임 채팅 앱인 '디스코드(Discord)' 서버 내에서 명령어(/imagine)를 쳐서 사용해야 하는 다소 기형적이고 불편한 인터페이스는 많은 초보자들의 진입을 막는 가장 큰 단점입니다. 또한 상업적으로 이미지를 활용하기 위해서는 무조건 유료 구독이 필수입니다.
DALL-E 3
AI ImageDALL-E 3는 OpenAI의 멀티모달 전략의 핵심으로, ChatGPT 플러스 생태계에 완벽하게 녹아든 직관적인 AI 이미지 생성기입니다. DALL-E 3의 가장 강력하고 차별화된 무기는 '프롬프트 이해력'입니다. 사용자가 대충 "우주에서 노트북을 하는 고양이"라고 짧게 입력하면, 뒤단에서 ChatGPT 모델이 이 문맥을 분석해 조명, 카메라 앵글, 화풍이 가미된 수백 자의 완벽한 프롬프트로 변환하여 이미지를 생성해 냅니다. 즉, 프롬프트 엔지니어링을 배울 필요가 아예 없는 도구입니다. 또한, 이미지 내부에 영문 텍스트(간판, 티셔츠 글귀 등)를 스펠링 오류 없이 매우 정확하게 렌더링하는 능력이 뛰어나 로고 제작이나 인포그래픽 작업에 독보적인 편의성을 자랑합니다. 그러나 미드저니에 비해 결과물이 다소 '플라스틱 질감'이 나거나 AI 특유의 인위적인 매끈함(Cartoonish)이 묻어나는 경향이 강해 극사실주의 상업 사진으로는 부적합할 때가 많습니다. 또한 OpenAI의 엄격한 윤리 및 검열 가이드라인으로 인해 폭력적이거나 선정적인 느낌이 조금이라도 포함된 키워드는 생성을 원천 거부당하는 제약이 매우 강합니다.
Adobe Firefly
AI ImageAdobe Firefly는 글로벌 디자인 소프트웨어의 표준인 어도비(Adobe)가 내놓은, 실무 디자이너와 기업 고객을 정조준한 상업용 생성형 AI입니다. Firefly의 가장 치명적인 무기는 바로 '저작권 안전성'입니다. 다른 AI 모델들이 웹상의 불법 데이터들을 무단 크롤링하여 학습했다는 윤리적 논란에 시달리는 반면, Firefly는 철저하게 Adobe Stock의 라이선스가 확보된 이미지와 퍼블릭 도메인으로만 학습되었습니다. 따라서 생성된 이미지를 상업용 광고나 기업 마케팅 자료에 써도 저작권 소송을 당할 위험이 0%입니다. 이 모델은 포토샵(Photoshop) 및 일러스트레이터(Illustrator) 내부에 'Generative Fill(생성형 채우기)'이라는 기능으로 완벽하게 이식되어 있습니다. 사용자는 이미지의 특정 부분을 올가미 툴로 잡고 프롬프트를 치는 것만으로 피사체를 추가/삭제하거나 배경을 완벽하게 이어붙여 확장할 수 있습니다. 무에서 유를 창조하는 능력을 넘어 기존 디자인 리소스를 조작하고 합성하는 데 세계 최고의 도구입니다. 다만, 단독 프롬프트 기반의 이미지 생성 퀄리티 자체는 아직 타 하이엔드 모델에 비해 밋밋하고 투박하다는 평가를 받습니다.
Leonardo.ai
AI ImageLeonardo.ai는 웹 브라우저 기반으로 동작하면서도 로컬 구동 방식의 Stable Diffusion에 버금가는 막강한 제어력과 파라미터 튜닝 기능을 제공하는 전문가 지향의 AI 이미지 플랫폼입니다. 이 서비스는 게임 개발자, 3D 모델러, 컨셉 아티스트들을 위해 특별히 설계된 다양한 커스텀 모델 파인튜닝 기능을 자랑합니다. 사용자는 사이트 내에서 제공되는 'RPG v4', 'Anime Pastel' 등 수십 가지의 특화된 베이스 모델을 클릭 한 번으로 선택할 수 있으며, 더 나아가 자신만의 이미지 10~20장을 업로드하여 특정 화풍이나 캐릭터 얼굴을 AI에게 직접 학습(Training)시키는 기능이 매우 쉽고 직관적으로 구축되어 있습니다. 특히 'Realtime Canvas' 기능은 사용자가 마우스로 대충 선을 그으면 실시간(Real-time)으로 완성된 고퀄리티 이미지가 옆 화면에 렌더링되어 나오는 혁신적인 스케치-투-이미지 기능을 제공합니다. 단점은 메뉴와 파라미터 설정(Guidance Scale, Prompt Magic 등)이 너무 방대하고 복잡하여 처음 진입하는 초보자에게는 UI가 다소 위압적으로 느껴질 수 있다는 점입니다.
Perplexity
AI SearchPerplexity AI는 구글이 20년간 독점해 온 검색 엔진 시장의 패러다임을 '링크 나열'에서 '직접적인 해답(Answer Engine)'으로 바꾸고 있는 선구적인 대화형 AI 검색 서비스입니다. 기존의 ChatGPT가 자신이 학습한 시점 이전의 과거 데이터만을 바탕으로 대답하여 최신 정보 오류나 환각(Hallucination) 현상을 일으키는 반면, Perplexity는 질문을 받는 즉시 실시간으로 방대한 웹 페이지, 뉴스 기사, 학술 논문을 크롤링하고 독해합니다. 그 후 신뢰성 높은 출처들의 정보를 종합하여 한 편의 완벽한 리포트 형태의 답변을 작성해 주며, 가장 중요한 점은 답변의 모든 문장에 [1], [2] 형식으로 원문 웹사이트 링크를 각주로 달아준다는 것입니다. 이를 통해 정보의 교차 검증(Fact-check)이 가능하여 대학원생의 논문 리서치, 마케터의 경쟁사 분석, 주식 트레이더의 시황 분석 등 신뢰도가 생명인 작업에서 폭발적인 생산성을 제공합니다. 유료 버전(Pro)에서는 분석 모델을 GPT-4o, Claude 3.5 등으로 자유롭게 스위칭하며 답변의 깊이를 한층 더 조절할 수 있습니다. 단, 창의적인 브레인스토밍이나 코딩 작성 등 순수 생성형 작업에서는 범용 챗봇에 비해 유연성이 약간 떨어진다는 단점이 있습니다.
NotebookLM
AI SearchNotebookLM은 구글(Google)에서 개발한 실험적이면서도 혁신적인 '개인 맞춤형 지식 리서치 AI'입니다. 이 도구는 외부 인터넷 정보를 무작위로 검색하는 것이 아니라, 철저하게 사용자가 직접 업로드한 소스 자료(최대 수백 개의 PDF 논문, 텍스트 문서, 구글 드라이브 문서 등)만을 학습의 출처(Grounding)로 삼습니다. 따라서 내가 보유한 자료의 범위 내에서만 정답을 생성하기 때문에 환각 현상이 발생할 확률이 사실상 0%에 수렴합니다. 수백 페이지에 달하는 방대한 전공 서적이나 복잡한 법률 판례 문서를 업로드하고 "이 자료들에서 핵심 쟁점 3가지를 요약하고 관련 페이지를 인용해줘"라고 지시하면, 순식간에 정확한 답변과 인용 링크를 제공합니다. 최근 전 세계적인 열풍을 일으킨 'Audio Overview' 기능은 업로드한 무미건조한 문서를 바탕으로 두 명의 가상 AI 진행자가 티키타카 토론을 벌이는 매우 자연스러운 팟캐스트 라디오 형식으로 변환시켜 주어, 귀로 정보를 습득하는 새로운 차원의 경험을 선사합니다. 단점은 내가 제공하지 않은 외부 정보와 결합하여 추론하는 능력은 제한적이라는 것입니다.
Genspark
AI SearchGenspark은 Perplexity와 유사한 AI 기반의 답변 엔진 플랫폼이지만, 정보의 취합을 넘어 특정 주제에 대한 완전히 구성된 '위키(Wiki) 스타일의 맞춤형 페이지'를 동적으로 생성해 준다는 점에서 독창적인 위치를 차지하고 있습니다. 사용자가 특정 키워드나 질문(예: '2026년 파리 올림픽 관광 가이드')을 입력하면, 단순한 텍스트 답변이 아니라 목차, 이미지, 최신 기사, 제품 리뷰, 심지어 관련 유튜브 비디오 링크까지 모두 한 페이지에 깔끔하게 구조화된 'Sparkpage'를 즉각적으로 퍼블리싱해 줍니다. 이 페이지 내에서는 각 정보의 출처가 투명하게 제공되며, 특정 단락을 클릭하여 AI에게 더 깊이 파고들도록 지시할 수도 있습니다. 제품 구매 전 복잡한 비교 리서치를 하거나 특정 학문적 주제에 대한 브리핑 자료를 만들어야 할 때, 여러 탭을 열어두고 구글링하는 시간을 획기적으로 줄여주는 정보의 큐레이터 역할을 합니다. 단점은 복잡한 데이터 분석이나 코딩 질문에 대해서는 여전히 ChatGPT나 Perplexity의 깊은 논리적 추론력을 따라가지 못하며, 생성된 위키 페이지의 퀄리티가 검색어에 따라 다소 편차가 있다는 점입니다.
SearchGPT
AI SearchSearchGPT는 구글의 아성에 도전하기 위해 OpenAI가 발표한 차세대 AI 기반 대화형 검색 엔진 프로토타입입니다. 기존 검색 엔진이 수많은 파란색 링크를 던져주고 사용자가 직접 클릭해 정보를 발굴하게 했다면, SearchGPT는 최신 웹 정보에 직접 접근하여 사용자의 의도를 분석한 뒤 즉각적이고 종합적인 해답을 깔끔한 요약과 함께 제시합니다. 답변 내의 정보들은 신뢰할 수 있는 퍼블리셔(뉴스 사이트, 공식 블로그 등)의 링크와 명확하게 연결되어 있으며, 답변 하단에는 관련된 후속 질문을 시각적인 모듈 형태로 제안하여 심층 탐색을 자연스럽게 유도합니다. 특히 OpenAI의 막강한 언어 이해 능력을 바탕으로 모호한 질문의 의도를 정확히 파악하고, 지역 기반 정보(날씨, 레스토랑 등)와 최신 뉴스 데이터를 실시간으로 결합하는 기술력이 돋보입니다. 장차 ChatGPT의 핵심 기능으로 흡수 통합될 예정입니다. 단점은 아직 소규모 사용자 대상의 프로토타입 단계이기 때문에 대중적인 접근이 제한적이며, Perplexity에 비해 학술 논문이나 극히 전문적인 딥다이브(Deep-dive) 리서치 역량은 검증이 더 필요하다는 점입니다.
Missing a tool?
Help us expand our directory by submitting tools you use and love.