DeepSeek

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., trading as DeepSeek, is a Chinese artificial intelligence company, based in Hangzhou, Zhejiang, that develops open-source large language models (LLMs). It is owned and funded by Chinese hedge fund High-Flyer, and was founded by Liang Wenfeng, who established the company in 2023 and serves as its CEO.

DeepSeek v3 vs GPT-4o vs 3.5 Sonnet

DeepSeek v3에 대한 노트 - "정말로 GPT-4o나 3.5 Sonnet보다 좋은가 | GeekNews
- [원문] Notes on the new Deepseek v3 - Composio

최종 평가: 추론: Deepseek v3 > Claude 3.5 Sonnet > GPT-4o; 수학: Deepseek v3 > Claude 3.5 Sonnet > GPT-4o; 코딩: Claude 3.5 Sonnet > Deepseek v3 ~ GPT-4o; 창작: Claude 3.5 Sonnet > Deepseek v3 ~ GPT-4o

누가 Deepseek v3를 사용해야 할까?: 대부분의 작업에서 GPT-4o를 대체 가능; 애플리케이션 구축한다면 최적. 비용 대비 성능이 뛰어나 사용자 애플리케이션 개발에 적합함; Open-weight 여서 자체 호스팅 가능, 더 큰 제어권 제공

DeepSeek-V3.2

DeepSeek-V3.2 공개 - 오픈 대형 언어 모델의 한계를 확장하다 | GeekNews
DeepSeek-V3.2는 높은 계산 효율성과 추론·에이전트 성능을 결합한 오픈소스 대형 언어 모델
새로운 DeepSeek Sparse Attention(DSA) 구조로 긴 문맥에서도 성능을 유지하며 계산 복잡도를 크게 절감
확장 가능한 강화학습(RL) 프레임워크를 통해 GPT-5 수준의 성능을 달성, 고성능 버전은 Gemini-3.0-Pro와 동등한 추론력 확보
대규모 에이전트형 작업 합성 파이프라인으로 1,800개 환경과 85,000개 프롬프트를 생성, 복잡한 상호작용 환경에서 일반화와 명령 수행력 향상
오픈모델이 폐쇄형 모델과의 격차를 좁히며, 비용 효율적 대안으로 자리매김

DeepSeek가 대규모에선 저렴하지만 로컬에서는 비싼 이유

DeepSeek가 대규모에선 저렴하지만 로컬에서는 비싼 이유 | GeekNews
- [원문] Why DeepSeek is cheap at scale but expensive to run locally | sean goedecke

DeepSeek-V3와 같은 일부 AI 모델은 대규모 제공 시 저렴하고 빠르지만 로컬 실행 시에는 느리고 비쌈.

그 이유는 GPU 활용 효율과 관련된 throughput(처리량)과 latency(지연시간) 의 근본적 트레이드오프에 있음.
배치 크기를 키우면 GPU가 효율적으로 동작하지만, 사용자는 토큰이 모일 때까지 대기해야 해 지연시간 증가 현상 발생
Mixture-of-Experts 구조와 딥 파이프라인을 가진 모델은 높은 배치와 지연시간을 필요로 함
로컬 단일 사용자 환경에서는 충분히 큰 배치 형성이 어려워 성능 저하 및 비용 증가 문제 발생
OpenAI, Anthropic 등은 아키텍처 자체의 효율화, 고도의 배치 전략, 또는 과도한 GPU 투입 등으로 빠른 응답을 구현

Favorite site

DeepSeek
Github - deepseek-ai/DeepSeek-V3
deepseek-ai/DeepSeek-V3-Base · Hugging Face
DeepSeek - Wikipedia
딥시크, 오픈 소스 사상 최대 규모 LLM 출시..."GPT-4o 따라 잡았다" < 산업일반 < 산업 < 기사본문 - AI타임스
AI 뉴스 - 역대급 오픈소스 딥시크 V3, o1 해킹 사건, AGI 정의, 페르소AI, 영상 AI 근황, 오픈AI 전환, 휴머노이드 로봇 발전 등 - YouTube
Ollama에 공식 DeepSeek R1 등록 | GeekNews (ollama)
- [원문] deepseek-r1
Meta의 생성형 AI 조직은 DeepSeek때문에 충격에 빠져있음 | GeekNews
DeepSeek R1의 추론 능력을 바탕으로 100분의 1 작은 ModernBERT 훈련하기 | GeekNews
DeepSeek의 R1-Zero 및 R1 분석 | GeekNews
- [원문] R1-Zero and R1 Results and Analysis
DeepSeek에서 검열한 1,156개의 질문들 | GeekNews
- [원문] 1,156 Questions Censored by DeepSeek | promptfoo
- Promptfoo 팀은 이 CCP 검열 의심 콘텐츠를 평가하기 위해, 1,360개의 ‘민감 주제’ 질문을 담은 데이터셋을 만들었음
- 실험 결과, DeepSeek-R1은 이 중 약 85%의 질문을 거부하는 고정 답변(canned refusal)으로 응답함
Anthropic CEO 다리오 아모데이: DeepSeek 모델은 그리 놀랍지 않다 | GeekNews
- [원문] Dario Amodei — On DeepSeek and Export Controls
DeepSeek, 유럽 기술 기업이 글로벌 AI 경쟁에서 따라잡을 기회를 제공하다 | GeekNews
- [원문] DeepSeek gives Europe's tech firms a chance to catch up in global AI race | Reuters
DeepSeek-V3.2-Exp: 실험적 장기 컨텍스트 최적화 모델 공개 | GeekNews

DeepSeek

DeepSeek v3 vs GPT-4o vs 3.5 Sonnet

DeepSeek-V3.2

DeepSeek가 대규모에선 저렴하지만 로컬에서는 비싼 이유

See also

Favorite site