JYP Garden

deepseek

5건의 항목

  • 2026년 5월 07일

    DeepSeek-V4 아키텍처

    • deepseek
    • sparse-attention
    • moe
    • pre-training
    • llm아키텍처
    • knowledge
  • 2026년 5월 07일

    Sparse Attention

    • llm아키텍처
    • attention
    • long-context
    • deepseek
    • knowledge
  • 2026년 5월 07일

    EP 95. DeepSeek-V4 논문 읽기 — 노정석

    • deepseek
    • llm
    • 모델아키텍처
    • sparse-attention
    • pre-training
    • ai뉴스
    • gpt-5.5
    • knowledge
  • 2026년 5월 06일

    Muon Optimizer

    • llm
    • 학습
    • optimizer
    • pre-training
    • deepseek
    • knowledge
  • 2026년 5월 06일

    mHC: Manifold-Constrained Hyper-Connections

    • llm
    • 아키텍처
    • residual-connection
    • deepseek
    • knowledge

Created with Quartz v5.0.0 © 2026