ESP32-S31 — 모든 무선 프로토콜을 한 칩에 넣은 임베디드의 변화

2026-06-05 · 2026-06-05_esp32-s31-all-in-one-iot-칩.md

#embedded #riscv #iot #espressif #maker

ESP32-S31 — 모든 무선 프로토콜을 한 칩에 넣은 임베디드의 변화

한 줄 요약

Espressif(에스프레시오)가 Wi-Fi 6, 블루투스 5.4, Thread/Zigbee, 기가비트 이더넷을 한 칩에 모두 넣은 ESP32-S31을 발표했으며, RISC-V 아키텍처로 전환하면서 임베디드 개발 진입 장벽이 크게 낮아지고 있다.

핵심 스펙

  • 프로세서: 듀얼코어 32비트 RISC-V, 최대 320MHz, SIMD 명령어 지원, 128비트 와이드 데이터 패스
  • 성능: 6.86 CoreMark/MHz — 기존 ESP32-S3의 LX7 코어(5.54 CoreMark/MHz)보다 약 2배 빠름
  • 메모리: 온칩 512KB SRAM, 250MHz 8비트 DDR PSRAM(기존 S3의 80MHz 대비 3배 이상)
  • GPIO: 60개(기존 S3의 45개 대비 증가)
  • 무선 연결:
  • Wi-Fi 6(802.11ax, 2.4GHz)
  • 블루투스 5.4(LE Audio + Direction Finding + Mesh 1.1)
  • 블루투스 클래식(BR/EDR) — 기존 오디오 기기와 호환
  • IEEE 802.15.4 — Thread 및 Zigbee 프로토콜 지원
  • 유선 연결: 1000Mbps 이더넷 MAC(기존 100Mbps RMII에서 업그레이드)
  • HMI(인간-기계 인터페이스): 카메라 DVP(8~16비트), LCD(8~24비트 RGB), JPEG 하드웨어 코덱, 14채널 커패시터 터치
  • 보안: TRNG(진짜 난수 생성기), RAM 기반 PUF(복제 불가능한 물리 함수), AES-128/256, RSA, ECDSA, 보안 부트, TEE(신뢰할 수 있는 실행 환경)
  • 추가: CAN-FD, 모터 PWM, 12비트 ADC, CORDIC 하드웨어 모듈, BitScrambler(DMA 전용 비트 연산기 2개)
  • 소프트웨어: ESP-IDF, ESP-Matter, ESP-BLE-AUDIO, ESP-GMF 프레임워크 지원
  • 현재 상태: 샘플이 일부 고객에게 제공 중, 일반 출시일 미정

Hacker News 커뮤니티 반응 (352 포인트, 192개 댓글)

1. RISC-V 전환 — 임베디드 개발의 민주화

가장 큰 화제는 RISC-V 아키텍처 채택이었다. 기존 임베디드 개발에서는 ARM이나 MIPS 같은 아키텍처를 쓸 때 제조사별 전용 도구 체인(toolchain)을 내려받아야 했는데, 대부분 제대로 작동하지 않는 경우가 많았다. RISC-V는 오픈 아키텍처라 표준화된 도구가 있다.

구체적 예시:

  • 기존 방식: Espressif SDK에 포함된 전용 컴파일러를 설치하고, 버전 호환성 문제를 해결하고, proprietary 도구로 빌드
  • RISC-V 방식: rustup target add riscv32imac-unknown-none-elf 한 줄로 끝남
  • 여기서 riscv32imac는 RISC-V 명령어 세트 확장을 나타냄 — I=기본 정수 연산, M=곱셈/나눗셈, A=원자성 명령어, C=압축 명령어

jamesmunns(ESP-RS 프로젝트 기여자)는 이미 esp-hal 라이브러리가 존재한다고 언급하며 Rust 기반 임베디드 개발 생태계가 빠르게 성장 중임을 암시했다.

2. 부동소수점(FPU) 논란

phkahler는 SIMD는 좋지만 하드웨어 부동소수점 연산기가 없어 보인다며 CORDIC 모듈(삼각함수 등을 하드웨어로 계산하는 모듈) 설명이 고정소수점 계산을 암시한다고 지적했다. 모터 제어에서는 1마이크로초(1μS, 100만 분의 1초) 이하의 ADC(아날로그-디지털 변환기) 변환 시간이 필요한데, 데이터시트에 명시되지 않았다고 비판했다.

polpo는 데이터시트에 "Single-precision floating-point unit (FPU) per core"라고 명시되어 있다고 반박했다. 즉 코어당 단정밀도 부동소수점 연산기가 있다는 뜻이다.

BenjiWiebe는 ADC 변환 시간은 Espressif 제품의 12비트 SAR ADC(순차 근접형 아날로그-디지털 변환기) 샘플링 레이트로 판단하면 약 10μS 수준일 것이라고 추정했다.

3. 모터 제어에서 빠른 피드백 루프가 필요한 이유

이 주제에서 깊은 기술적 논의가 이어졌다. 모터 제어나 SMPS(스위칭 모드 전원 공급 장치)에서는 센서 데이터의 대역폭에 변환 지연과 계산 지연이 합쳐지면 최대 동작 루프 대역폭이 낮은 수십 kHz에 불과해진다. 그 이상으로 가면 과잉 응답이나 진동이 발생한다.

GeorgeTirebiter의 경험칙: 저수준 하드웨어가 PID(비례-적분-미분 제어) 응답을 부드럽게 처리하고, 고수준 컨트롤러가 목표값(setpoint)을 생성한다. 응답이 빠를수록 I(적분)나 D(미분) 항에 의존할 필요가 줄어든다.

4. Espressif 제품 라인업의 '혼란'은 의도적 전략

peteforde가 잘 설명한 대로, ESP32 제품군이 복잡해 보이는 것은 실수가 아니라 의도적인 비즈니스 전략이다. 실제로는 4~5개의 제품 라인(S 시리즈, C 시리즈, H 시리즈, P 시리즈)이 있고, 각각이 동일한 SDK(소프트웨어 개발 키트), 설계 철학, 가격 구조, 공급망, 지원 채널을 공유한다.

핵심 논리: 엔지니어링 팀에 중요한 것은 "ESP32 라벨의 칩을 PCB(인쇄 회로 기판)에 실장하고 동일한 SDK로 프로그래밍할 수 있는가"이다. 제품 라인이 통합되어 있으면 고객이 다른 제조사로 이동할 인센티브가 줄어든다.

alnwlsn은 Raspberry Pi Pico(RP2030 마이크로컨트롤러)와 단일 보드 컴퓨터 버전을 혼동하는 것과 비슷하다고 비유했다. "ESP32"라고 하면 여전히 클래식 WROOM-32E가 먼저 생각난다는 점도 지적했다.

5. 부품 번호 길이에 대한 불만

alnwlsn: Espressif는 SKU(재고 관리 단위)가 312개뿐인데, 3분의 2 이상이 18자 이상의 부품 번호를 가진다. BOM(자재 목록) 표에 넣기 불편하다.

reaperducer: 소니도 비슷하다. 애플은 AirPods라고 짧게 부르지만, 소니 이어폰 모델명은 WMDF559J649Q-1 수준이다.

6. BitScrambler — 독특한 기능

redfast00이 소개한 BitScrambler는 WS2812 LED 스트립(개별 주소가 있는 RGB LED)의 비트 조작을 CPU 없이 DMA(직접 메모리 접근) 전용 하드웨어가 처리하는 기능이다. 비트 연산이 CPU 집약적이므로, 메모리→주변기기와 주변기기→메모리 방향 각각 전용 모듈 2개를 통합했다.

7. ESP32-P4와의 비교

oritron: RISC-V + SIMD에 관심이 있다면 이미 출시된 ESP32-P4도 확인하라고 권했다. 시계속도는 더 빠르지만 무선 기능이 없다. DSP(디지털 신호 처리) + 이미지 처리로 픽셀 데이터를 많이 처리하는 WLED 프로젝트 사례가 있다.

Aurornis: P4가 가진 MIPI(모바일 산업 프로세서 인터페이스) 지원은 S31에서 사라졌다.

8. 512개 ESP32 클러스터 아이디어

rbanffy: 16개를 묶어 Connection Machine 큐브(병렬 컴퓨팅 아키텍처)를 만들고, 512개 클러스터를 구축해서 비현실적인 노드 수의 클러스터 관리법을 배워보자고 제안했다.

throwup238이 실제 구성을 제안했다: ESP32 RGMII 인터페이스(32개) → PHY 칩(32개 RTL8211F) → 슬레이브 스위치(6개 RTL8367) → 마스터 스위치(1개) → 마그네틱스(외부 포트용).

Hackaday 추가 정보

  • Espressif 직원의 설명: "CPU 아키텍처가 이름의 일부가 될 의도는 없었다. 99.9%의 사용자에게는 중요하지 않다. C나 다른 언어로 코드를 작성하면 컴파일러가 모든 명령어 세트 차이를 숨겨준다."
  • Linux 실행 가능성: MMU(메모리 관리 단위)는 있지만 내부 SRAM이 512KB라 메모리 대역폭(~0.5GB/s)과 총 RAM(<16MB)으로 Linux 실행은 "자살" 수준으로 불렸다.
  • Wi-Fi 6의 실제 이점: 2.4GHz 대역은 혼잡하지만, Wi-Fi 6의 OFDMA(다수 클라이언트가 채널을 예측 가능하게 공유), TWT(목표 깨우기 시간), BSS 컬러링(중복 네트워크 구분) 기능으로 혼잡한 환경에서도 유효 처리량이 높아진다.

새로운 시각

1. "All-in-one" 연결성의 실제 의미

Wi-Fi 6 + BT 5.4 + Thread/Zigbee + 이더넷을 한 칩에 넣은 것은 스마트 홈 허브, 비디오 도어폰, 산업용 IoT 게이트웨이 등 여러 프로토콜을 동시에 처리해야 하는 디바이스에 혁신적이다. 기존에는 2~3개 칩을 썼던 것을 하나로 줄일 수 있어, PCB 면적과 전력 소모, 비용이 모두 줄어든다.

구체적 예시: 스마트 홈 허브를 만들 때 기존에는 Wi-Fi 칩 + 블루투스 칩 + Zigbee 칩을 별도로 실장해야 했다. ESP32-S31 하나로 세 가지 무선 프로토콜을 동시에 처리할 수 있다.

2. RISC-V 전환의 숨은 이점 — Rust 생태계와의 자연스러운 통합

단순히 "오픈 아키텍처"를 넘어, Rust 프로그래밍 언어 생태계와의 자연스러운 통합이 임베디드 개발 진입 장벽을 크게 낮추고 있다. rustup target add 한 줄로 끝나는 개발 환경 구축 경험은 기존 ARM/MIPS 생태계에서는 불가능했다. 이는 임베디드 프로그래밍을 배우려는 학생이나 취미 개발자에게 중요한 변화다.

3. Espressif의 전략적 모호함 — 고객 이탈 방지

제품 라인업이 복잡해 보이는 것은 실수가 아니라 의도적 전략이다. 동일한 SDK/공급망/지원 채널을 공유함으로써 고객이 다른 제조사로 이동하는 것을 방지한다. TI(텍사스 인스트루먼츠)처럼 10년 이상 지원하는 산업용 칩과는 다른 비즈니스 모델이다. IoT 디바이스는 보안 업데이트를 위해 빈번한 하드웨어 리비전이 필요하므로, Espressif의 빠른 진화 모델이 오히려 적합할 수 있다.

미래 영향력

임베디드 개발 생태계 변화

RISC-V + Rust 조합이 임베디드 시스템 표준으로 자리잡을 가능성이 높다. 특히:

  • 교육용: 고등학생도 rustup 한 줄로 임베디드 개발 환경을 구축할 수 있다
  • 메이커: WS2812 LED, 카메라, 터치, 모터 제어가 모두 가능한 칩이 수 달러에 나온다면, 집에서 로봇이나 스마트 홈 디바이스를 직접 만드는 진입 장벽이 크게 낮아진다
  • 직업적: 임베디드 시스템 엔지니어가 RISC-V + Rust 스택을 일찍 배우면 미래 경쟁력이 된다

스마트 홈 / IoT 시장

한 칩에 모든 프로토콜을 넣으면 스마트 홈 디바이스 가격이 내려가고, 기능이 많아진다. 예를 들어 비디오 도어폰에 Wi-Fi + 블루투스 + Zigbee가 모두 있으면, 도어폰이 동시에 스마트 홈 허브 역할도 할 수 있다.

자녀에게 설명하면

"ESP32-S31은 작은 컴퓨터 칩이야. 이 칩 하나에 무선 인터넷(Wi-Fi 6), 블루투스, 지그비(집 안 기기끼리 통신하는 기술), 유선 인터넷(이더넷)이 모두 들어가. 예전에는 이 각각의 기능을 위해 다른 칩을 여러 개 붙여야 했는데, 이제는 하나면 돼. 가격은 수 달러 수준이라, 집에서 작은 로봇이나 스마트 조명 같은 걸 직접 만들어볼 수 있어. 그리고 이 칩이 쓰는 RISC-V라는 설계도는 무료라, 누구나 자유롭게 프로그램을 작성할 수 있어."

---

═══ Claude 보강·통찰 (2026-06-05) ═══ 위 정리(local LLM 판)에 비어 있던 두 논점 — "엣지 AI"의 실제 한계와 "중국제" 우려의 결 — 을 채우고, FPU 사실 하나를 확정한 뒤, 통찰을 요약한다. 출처: HN 댓글 트리(thehk·kjlldld 스레드), Espressif 제품/보도 페이지, Hackaday.

사실 확정 — FPU는 있다 (RV32IMAFCP), 그리고 이종 듀얼코어다

위 본문의 FPU 논쟁은 polpo가 옳다. ESP32-S31의 고성능(HP) 코어는 RV32IMAFCP — 문자열의 F가 단정밀도 부동소수점 연산기(FPU)를 뜻한다(I=정수, M=곱셈/나눗셈, A=원자성, F=단정밀도 float, C=압축, P=패킹 SIMD). phkahler의 "FPU 없음"은 CORDIC 설명을 보고 내린 첫인상 오류였고, 데이터시트가 코어당 FPU를 명시한다. 더 정확히는 이종(heterogeneous) 듀얼코어 — FPU·128비트 SIMD를 가진 HP 코어 + 별도의 저전력(LP) 코어 구조다. 댓글에 보이던 riscv32imac 타깃(F·P 없음)은 LP 코어 쪽 표기로 이해하면 모순이 풀린다.

빈 칸 ① — "엣지 AI"는 칩의 정체가 아니라 마케팅 수사다

본문이 다루지 않은 가장 큰 스레드 중 하나가 AI 성능 논의다. thehk가 제품 문구("particularly well suited for edge AI ... including neural network inference")를 인용하며 "depth-anything 같은 모델을 돌리면 성능이 어느 정도냐"고 묻자, 전문가 댓글이 만장일치로 제동을 걸었다.

  • otterdude: "무엇이 이걸 'AI 칩'으로 만드는지 모르겠다. 듀얼코어 320MHz로는 비전 모델을 (빠르게) 못 돌린다."
  • porridgeraisin: "병목은 메모리다. PSRAM 8MB 수준이면 양자화한 10~15층 소형 CNN, 이미지 분류, '내 고양이가 키보드 위에 있나' 식 분류, 얼굴 검출까지. 오디오는 훨씬 여유 있다."
  • asadm: "안 된다. 기껏해야 YOLO나 FastDepth 정도."
  • mattalex: "마이크로컨트롤러에선 여전히 CNN이 왕이다 — 피크 메모리 수요가 낮아서다. depth-anything은 여기서 안 돌린다."

핵심: 전용 NPU가 없다. AI는 HP 코어의 SIMD+FPU로 처리한다. 즉 "neural network inference"는 비전 모델을 떠올리게 하지만, 현실 상한은 양자화 소형 CNN 분류·얼굴 검출·웨이크워드(wake-word) 감지·오디오다. 이 칩의 진짜 도약은 'AI'가 아니라 무선 3종 + 기가비트 유선 + RISC-V를 한 다이에 합친 통합도이고, 커뮤니티 평가도 그쪽으로 수렴한다("원조 ESP32의 후계자", "WiFi와 유선이 같은 칩에 돌아온 게 반갑다").

💡 NPU(Neural Processing Unit)는 신경망 곱셈-누산을 전담하는 가속기입니다. 스마트폰·최신 MCU엔 흔하지만 ESP32-S31엔 없어서, AI 연산이 범용 코어(SIMD)에 얹힙니다. wake-word는 "헤이 시리" 같은 호출어만 상시 감지하는, 메모리·연산이 가장 가벼운 추론 과제입니다.

빈 칸 ② — "중국제 우려"는 한 덩어리가 아니라 세 축이다

본문이 빠뜨린 또 다른 스레드. kjlldld의 "이 칩들이 다 중국제라는 게 걱정되지 않나?"에 대해, 스레드 자체가 우려를 스스로 분해했다. chrisco255가 "Espressif는 오픈소스라 괜찮다"고 했다가 즉시 철회("아니다 — 칩은 오픈소스가 아니고 SDK 일부만"). 정리된 결론은 서로 다른 세 축이다.

  • (a) 개방성 — 칩 자체는 오픈소스가 아니다. SDK 일부만.
  • (b) 국가안보 — "정부·국가안보 기기엔 안 쓰겠다"(chrisco255). 이건 수입 제한의 1차 근거.
  • (c) 공급망·조달 — 제품화 시 글로벌 무역 역학이 리스크 요인. 보안과는 다른 축.

가장 개방적 대안으로 Baochip(crowdsupply)이 언급됐는데, 그 이름 'dabao'가 중국어로 '포장(테이크아웃)'이라는 점은 — 공급망 탈중국이 구호만큼 깔끔하지 않다는 작은 아이러니다. 즉 "중국제라 걱정"을 사실로 받기 전에, 셋 중 어느 축의 우려인지 먼저 물어야 한다.

통찰 요약 (3)

  1. AI 칩이 아니라 통합 칩이다. "엣지 AI" 라벨은 시장 압력의 산물이지 칩의 정체가 아니다. 라벨이 아니라 메모리·연산·전용 가속기(NPU)의 유무라는 1차 제약을 먼저 봐야 한다.
  2. RISC-V의 배당은 성능보다 진입장벽 붕괴다. Sprite_tm 말대로 ISA는 최종 사용자에게 거의 무의미하지만, "독점 SDK 설치"가 "rustup target add 한 줄"로 바뀌는 마찰계수의 변화는 실질이다. 역설적으로 RV32IMAFCP를 아무도 외울 필요 없어지는 게 이 전환의 목표다.
  3. 네이밍 혼란은 ISA가 마케팅 축에서 퇴장한다는 신호다. 본문의 peteforde("의도적 전략")와 topspin("S가 Xtensa를 뜻한 적은 없다 — S/C/P는 성능 등급")은 같은 동전의 양면이다. Espressif는 제품을 ISA가 아니라 등급으로 재편 중이고, 혼란은 그 전환기의 비용이다.

저와 아이들에게

저는 간담췌 의사라 이 칩을 업무에 쓸 일은 없습니다. 그래도 세 가지로 와닿습니다.

  • STEM 진입장벽으로서(통찰 ②): 아이와 LED 아트나 센서 프로젝트를 시작할 때, 반쯤 깨진 SDK와 싸우는 대신 한 줄로 시작할 수 있다는 건 실질적인 변화입니다. 5만 원대 개발보드 하나면 됩니다.
  • 마케팅 수사 읽는 법의 교본으로(통찰 ①): "엣지 AI/신경망 추론"이 실제로는 "양자화 소형 CNN까지"였던 이 사례는, 제 분야의 "AI 진단 기기" 홍보를 읽을 때 그대로 적용됩니다. 라벨이 아니라 1차 제약을 먼저 보는 습관은 아이에게도, 저에게도 가르칠 값어치가 있습니다.
  • 공급망 리터러시(빈 칸 ②): "중국제라 걱정"을 보안·조달·개방성 세 축으로 쪼개 보는 사고는, 의료기기 도입 의사결정에서도 똑같이 유효합니다.

관련 노트