국내 공공 임상 데이터셋 4종
임상 발화 115만건+
심리상담 음성 1,661시간
감정 유형 60가지
구조화 상담 세션 1,661건
공감 대화 3,000건+/감정
치료 프레임워크 7종
커버 진단군 10가지
1. 랜딩페이지 수치 근거 요약
| 표기 수치 |
실제 데이터 규모 |
데이터셋 / 출처 |
| A. 임상 대화 데이터 |
90만건+ 국내 임상 발화 |
115만 발화 의사 30만 + 간호사 40만 + 환자 45만 |
비대면 진료를 위한 의료진 및 환자 음성 |
| B. 심리상담 · 위기 데이터 |
1,661시간 심리상담 음성 |
1,661건 · 1,661시간 우울 484건 · 불안 487건 · 중독 448건 · 일반 242건 |
심리상담 데이터 |
1,661건 구조화 상담 세션 |
실제 상담사-내담자 세션 라벨링 토큰 465,474개 |
심리상담 데이터 (동일 데이터셋) 우울·불안·중독 구조화 상담 프로토콜 기반 |
| C. 감성·공감 대화 데이터 |
60가지 감정 유형 인식 |
60가지 세부 감정 6개 기본감정 × 10개 세부감정 |
감성 대화 말뭉치 음성 10,000문장 + 텍스트 27만문장 |
3,000건+ 공감 대화 (감정당) |
감정별 3,000개 발화 총 21,000개 (7감정 × 3,000) |
감정 음성합성 데이터셋 고품질 공감형 응답 레퍼런스 |
| D. 제품 기능 (자체 집계) |
10가지 커버 진단군 |
우울증·불안장애·공황장애·산후우울증·직장인 번아웃·ADHD·PTSD·양극성장애·OCD·중독 |
인테루나 환자 앱 기능 명세 (자체 집계) |
7종 치료 프레임워크 |
DBT · CBT · ACT · MI · MBT · TFP · GPM |
인테루나 임상 설계 명세 (자체 집계) |
2. 핵심 데이터셋 상세
비대면 진료를 위한 의료진 및 환자 음성
- 의사 발화 30만 문장 / 300시간
- 간호사 발화 40만 문장 / 400시간
- 환자 발화 45만 문장 / 600시간
- 텍스트 코퍼스 15만 문장 추가
- 총 115만+ 발화
심리상담 데이터
- 음성 파일 1,661건 (1,661시간)
- 우울증 484건 · 불안장애 487건
- 중독 448건 · 일반군 242건
- 라벨링 토큰 465,474개
- 실제 상담사-내담자 구조화 세션
감성 대화 말뭉치
- 6대 기본감정 × 10가지 세부 = 60가지 감정 유형
- 음성 데이터 10,000문장
- 텍스트 코퍼스 27만 문장
- 분노·슬픔·불안·상처·당황·기쁨 각 세부 분류
감정 음성합성 데이터셋
- 7개 감정 각각 3,000개 발화
- 총 21,000개 공감 발화
- 고품질 공감형 응답 레퍼런스 데이터
- 실시간 유사도 검색 기반 활용
3. 참고 출처
국내 공공 임상 데이터. 비대면 진료를 위한 의료진 및 환자 음성. 의사 30만 · 간호사 40만 · 환자 45만 발화. 총 115만+ 발화 수록.
국내 공공 임상 데이터. 심리상담 음성. 우울·불안·중독·일반군 1,661건 구조화 세션 수록. 라벨링 토큰 465,474개.
국내 공공 임상 데이터. 감성 대화 말뭉치. 6대 기본감정 × 10개 세부감정 = 60가지 감정 분류 체계. 음성 10,000문장 + 텍스트 27만문장 수록.
국내 공공 임상 데이터. 감정 음성합성. 7개 감정 × 3,000발화 = 총 21,000개 고품질 공감형 발화 수록.
인테루나 임상 설계 명세 (내부 문서). 환자 앱 AI 루나 — 진단군 10가지 · 치료 프레임워크 7종 커버리지. 2026. DBT · CBT · ACT · MI · MBT · TFP · GPM 기반 대화 프로그램 설계.
면책 고지
본 문서에 인용된 데이터셋은 국내 공공 임상 데이터로, 허가된 이용 범위 내에서 활용되었습니다.
인용된 수치는 각 데이터셋의 공식 명세를 기준으로 작성되었으며, 변경될 수 있습니다.
본 브리프는 영업·도입 검토용 참고 자료이며, 개별 환자 진단 또는 임상 의사결정의 근거로 사용될 수 없습니다.
This document references publicly available domestic clinical datasets used within permitted scope. Figures are based on official dataset specifications and subject to change. This brief is for reference purposes only and does not constitute clinical guidance.