Cyra Dong
Cyra Dong
Cai Dong · 董猜 · 동채하
AI Builder LLM Engineer Agent Systems Crypto × AI Multimodal ML
Statistics & Philosophy @ Yonsei. Building LLM applications, multimodal ML pipelines, and agentic systems. Interested in AI ✕ Crypto infrastructure and AI ✕ Clinical Neuroscience.
延世大学统计与哲学双学位。专注于 LLM 应用、多模态机器学习与自动化系统构建。关注 AI ✕ 加密基础设施及 AI ✕ 临床神经科学。
연세대학교 통계학·철학 복수전공. LLM 애플리케이션, 멀티모달 ML 파이프라인, 에이전트 시스템을 구축하고 있습니다. AI ✕ 암호화폐 인프라 및 AI ✕ 임상 신경과학에 관심이 있습니다.
Tech Stack
Languages
PythonTypeScriptRSQL
LLM / AI
OpenAIDeepSeekClaudeHuggingFace
Multimodal / ML
MediaPipeOpenSMILEPy-FeatPyTorch
Data / Engineering
pandasFastAPIPostgreSQLDocker
Crypto / Web3
Ethers.js
Languages
中文 · 母语한국어 · 유창 (TOPIK 6)English · Fluent (IELTS 8.0)日本語 · 日常会話 (N2)
Interests
LiteratureFashionMusic
Experience
Sanhua Holding Group
AI Engineer Intern · Digital AI Division · Hangzhou
  • Integrated dual LLM APIs (OpenAI + DeepSeek) for internal knowledge Q&A prototype; designed prompt templates and response parsing workflows
  • Cleaned ~10K equipment logs and supply chain records with Python/pandas for downstream AI/ML pipelines
Penn Medicine · University of Pennsylvania
Research Assistant — AI4ClinicalPsychology Lab
  • Built multimodal ML pipeline: video → feature extraction (MediaPipe/OpenSMILE) → emotion classification → LLM-based therapist evaluation; automated 3,000+ video samples
  • Conducted meta-analysis of 20+ clinical studies using Covidence to identify treatment efficacy moderators
Stanford Psychophysiology Lab
Research Assistant · EMA-Sleep-Diary-Data-Cleaning-Pipeline ↗
  • Engineered 4-layer auditable R pipeline processing 10K+ participants, extracting 7 core sleep behavior metrics
  • Developed three-stage parsing framework (decision tree + temporal correction) resolving noisy free-text and timestamp anomalies
Zhejiang Univ. of Sci & Tech
Research Technician · Social Psych Lab
  • Built analysis pipeline for 1,070 survey responses; designed PsychoPy experiments on AI trust and decision-making
  • Co-authored manuscript submitted to Journal of Applied Social Psychology
WashU Speech & Hearing Lab
Research Assistant
  • Quantifying lexical difficulty and modeling bilingual phonological permeability to explain cross-linguistic interaction patterns
Projects
Multimodal Clinical Emotion Recognition Pipeline
Python · MediaPipe · OpenSMILE · Py-Feat · LLM Eval Layer
End-to-end system: raw video → facial + acoustic feature extraction → ML classification → LLM-based evaluation. Automated 3,000+ video assessments for Penn Medicine.
ClinicalBERT Trauma Text Classification
HuggingFace · ClinicalBERT · PyTorch
Fine-tuned ClinicalBERT for clinical trauma text classification achieving F1=0.84. Designed stratified sampling to address class imbalance.
Education
Yonsei University
B.S. Applied Statistics · B.A. Philosophy (double major)
Minor: English Language & Literature
2023 – 2027 (expected)
GPA: 3.89/4.3
Washington University in St. Louis
Exchange · Philosophy-Neuroscience-Psychology track
Jan 2025 – May 2025
GPA: 3.75/4.0
Activities & Honors
AYUI — Yonsei Undergraduate Immunologists Association
Jinri (진리) Scholarship — Yonsei University (awarded twice)
Secret Book Club — English literature & wine tasting society
PKU Peiwen Cup — National 2nd Prize in Literary Writing (2018)
研究与实践经历
三花控股集团
AI 工程实习生 · 数字化AI事业部 · 杭州
  • 集成 OpenAI + DeepSeek 双 LLM API,设计提示模板与响应解析流程,构建内部知识问答原型系统
  • 使用 Python/pandas 清洗约 10,000 条设备日志及供应链数据,为下游 AI/ML 管道提供高质量数据集
宾夕法尼亚大学医学院
研究助理 — AI4ClinicalPsychology Lab
  • 构建多模态机器学习管道:视频 → 特征提取(MediaPipe/OpenSMILE)→ 情绪分类 → 基于 LLM 的治疗质量评估;自动化处理 3,000+ 临床视频样本
  • 使用 Covidence 对 20+ 临床研究进行元分析,识别治疗效果的关键调节变量
斯坦福大学心理生理学实验室
研究助理 · EMA-Sleep-Diary-Data-Cleaning-Pipeline ↗
  • 构建四层可审计 R 语言数据管道,处理 10,000+ 参与者数据,提取 7 项核心睡眠行为指标
  • 开发三阶段解析框架(决策树 + 时间校正算法),解决自由文本噪声和时间戳异常问题
浙江科技大学 · 社会心理学实验室
研究技术员
  • 构建 1,070 份问卷的全分析管道;独立设计 PsychoPy 行为实验,研究 AI 信任与决策机制
  • 合著论文已提交至 Journal of Applied Social Psychology
项目精选
多模态临床情绪识别管道
Python · MediaPipe · OpenSMILE · Py-Feat · LLM 评估层
端到端系统:原始视频 → 面部表情 + 声学特征提取 → ML 分类 → LLM 评估。为宾夕法尼亚大学医学院构建自动化 3,000+ 视频评估管道。
ClinicalBERT 创伤文本分类
HuggingFace · ClinicalBERT · PyTorch
微调 ClinicalBERT 实现临床创伤文本分类,F1 达 0.84。设计分层采样解决类别不平衡问题。
教育背景
延世大学
应用统计学 理学士 · 哲学 文学士(双学位)
辅修:英语语言文学
2023 – 2027(预期)
GPA: 3.89/4.3
圣路易斯华盛顿大学
交换项目 · 哲学-神经科学-心理学方向
2025.01 – 2025.05
GPA: 3.75/4.0
论文发表
对他人 AI 态度的低估:对 AI 采纳的影响 — 第三作者;Journal of Applied Social Psychology
感知经济不平等抑制亲环境行为 — 第三作者;British J. Social Psychology, 64(2), e12815
基于 EMA 与被动感知的次日自杀冲动预测 — 海报展示,ABCT 2025 年会
活动与荣誉
AYUI — 延世大学本科生免疫学会
真理(진리)奖学金 — 延世大学(两次获得)
秘本读书会 — 英国文学与红酒品鉴社团
北京大学培文杯 — 文学写作全国二等奖(2018)
경력
Sanhua Holding Group (삼화홀딩스)
AI 엔지니어 인턴 · 디지털AI사업부 · 항저우
  • OpenAI + DeepSeek 듀얼 LLM API 통합하여 내부 지식 QA 프로토타입 구축; 프롬프트 템플릿 및 응답 파싱 워크플로 설계
  • Python/pandas로 약 10,000건의 장비 로그 및 공급망 데이터 정제하여 AI/ML 파이프라인에 공급
펜 의과대학 · University of Pennsylvania
연구보조원 — AI4ClinicalPsychology Lab
  • 멀티모달 ML 파이프라인 구축: 비디오 → 특징 추출(MediaPipe/OpenSMILE) → 감정 분류 → LLM 기반 치료 평가; 3,000+ 비디오 샘플 자동화
  • Covidence를 활용한 20+ 임상 연구 메타분석을 통해 치료 효과 조절 변수 식별
스탠포드 정신생리학 연구소
연구보조원 · EMA-Sleep-Diary-Data-Cleaning-Pipeline ↗
  • 4계층 감사 가능한 R 파이프라인 구축, 10,000+ 참가자 데이터 처리, 7개 핵심 수면 행동 지표 추출
  • 3단계 파싱 프레임워크(의사결정나무 + 시간 보정) 개발로 자유 텍스트 노이즈 및 타임스탬프 이상 해결
절강과학기술대학교 · 사회심리학연구소
연구 기술원
  • 1,070건 설문 응답 분석 파이프라인 구축; AI 신뢰도 및 의사결정 연구를 위한 PsychoPy 실험 설계
  • 공동 저술 논문 Journal of Applied Social Psychology에 제출
WashU 언어청각연구소
연구보조원
  • 어휘 난이도 정량화 및 이중언어 음운 투과성 모델링을 통한 교차언어 상호작용 패턴 분석
프로젝트
멀티모달 임상 감정 인식 파이프라인
Python · MediaPipe · OpenSMILE · Py-Feat · LLM 평가 레이어
엔드투엔드 시스템: 원본 비디오 → 얼굴 표정 및 음향 특징 추출 → ML 분류 → LLM 기반 평가. Penn Medicine에서 3,000+ 비디오 평가 자동화.
ClinicalBERT 외상 텍스트 분류
HuggingFace · ClinicalBERT · PyTorch
ClinicalBERT 미세조정으로 임상 외상 텍스트 분류, F1=0.84 달성. 클래스 불균형 해결을 위한 계층적 샘플링 설계.
학력
연세대학교
응용통계학 이학사 철학 문학사(복수전공)
부전공: 영어영문
2023 – 2027 (예정)
GPA: 3.89/4.3
Washington University in St. Louis
교환학생 · 철학-신경과학-심리학 트랙
2025.01 – 2025.05
GPA: 3.75/4.0
활동 및 수상
AYUI — 연세대학교 학부 면역학회
진리 장학금 — 연세대학교 (2회 수혜)
The Secret Book Society — 영문학 & 와인 동아리
북경대학교 배문컵 — 문학창작 전국 2등상 (2018)
GitHub Repositories
Loading repositories