1. AI 추론 시대를 위해 만들어진 칩 — Google TPU (The chip made for the AI inference era – the Google TPU)
    2026-06-04 · #semiconductor #ai-inference #google-tpu #nvidia #cuda

    AI 추론 시대를 위해 만들어진 칩 — Google TPU The chip made for the AI inference era – the Google TPU Rihard Jarc, 2025 11 24, UncoverAlpha Substack . 좋아요 153, 댓글 3. 같은 글이 2025 11 27 Hacker New...

  2. tiny-vllm: C++와 CUDA로 vLLM을 직접 구현하며 배우는 LLM 추론 엔진
    2026-06-01 · #reflection #ai #llm #cuda #inference

    tiny vllm: C++와 CUDA로 vLLM을 직접 구현하며 배우는 LLM 추론 엔진 개요 출처 : PyTorchKR discuss.pytorch.kr , 2026.06.01 작성자 : 9bow 박정환 — GPT 모델로 정리한 글 바탕으로 작성 게시판 : 읽을거리&정보공유 태그 : llm inference, vllm,...