<aside>
✅ 데이터 구성
</aside>
- 국제 질병 분류 OUD 진단 코드가 있는 환자의 퇴원 요약 포함
- 최종 주석 스키마에는 33개의 클래스가 포함
- 3,270개의 주석이 포함 OUD와 관련된 자연어 처리 시스템의 향후 개발에 유용
- 23개의 csv 파일
OUD (오피오이드 사용 장애)
- 종종 높은 이환율과 사망에 관련된 만성적이고 재발하는 상태를 말함
- 오피오이드란, 마약성 진통제를 가리킴
<aside>
✅ 데이터 설명
</aside>
- 약 60,000명의 환자에 대한 임상 데이터를 포함하는 공개적으로 사용 가능한 비식별화된 데이터 세트
- 최종 주석 스키마에는 33개의 클래스가 포함
<aside>
✅ 사용 모델
</aside>
- 전통적인 기계 학습자 (로지스틱 회귀) 및 딥 러닝 접근 방식 (ELECTRA의 토큰 교체 감지 모델을 기반으로 한 Autogluon)을 사용하여 분류를 위해 예측 모델을 훈련하고 테스트
<aside>
✅ Abstract
</aside>
- OUD의 문서화된 징후 및 증상과 사회적 위험 및 행동으로 구조화된 EHR 데이터를 풍부하게 함
- 환경 요인을 심층적으로 특성화하기 위해 주석 스키마 개발하고 적용하는 것을 목표로 함
- 주석 스키마 자동화