-
AI 추론 시대를 위해 만들어진 칩 — Google TPU (The chip made for the AI inference era – the Google TPU)
AI 추론 시대를 위해 만들어진 칩 — Google TPU The chip made for the AI inference era – the Google TPU Rihard Jarc, 2025 11 24, UncoverAlpha Substack . 좋아요 153, 댓글 3. 같은 글이 2025 11 27 Hacker New...
-
tiny-vllm: C++와 CUDA로 vLLM을 직접 구현하며 배우는 LLM 추론 엔진
tiny vllm: C++와 CUDA로 vLLM을 직접 구현하며 배우는 LLM 추론 엔진 개요 출처 : PyTorchKR discuss.pytorch.kr , 2026.06.01 작성자 : 9bow 박정환 — GPT 모델로 정리한 글 바탕으로 작성 게시판 : 읽을거리&정보공유 태그 : llm inference, vllm,...