Cyra Dong · Cai Dong

Cyra Dong

Cai Dong · 董猜 · 동채하

AI Builder LLM Engineer Agent Systems Crypto × AI Multimodal ML

· · ·

Statistics & Philosophy @ Yonsei. Building LLM applications, multimodal ML pipelines, and agentic systems. Interested in AI ✕ Crypto infrastructure and AI ✕ Clinical Neuroscience.

延世大学统计与哲学双学位。专注于 LLM 应用、多模态机器学习与自动化系统构建。关注 AI ✕ 加密基础设施及 AI ✕ 临床神经科学。

연세대학교 통계학·철학 복수전공. LLM 애플리케이션, 멀티모달 ML 파이프라인, 에이전트 시스템을 구축하고 있습니다. AI ✕ 암호화폐 인프라 및 AI ✕ 임상 신경과학에 관심이 있습니다.

Tech Stack

Languages

PythonTypeScriptRSQL

LLM / AI

OpenAIDeepSeekClaudeHuggingFace

Multimodal / ML

MediaPipeOpenSMILEPy-FeatPyTorch

Data / Engineering

pandasFastAPIPostgreSQLDocker

Crypto / Web3

Ethers.js

Languages

中文 · 母语한국어 · 유창 (TOPIK 6)English · Fluent (IELTS 8.0)日本語 · 日常会話 (N2)

Interests

LiteratureFashionMusic

Experience

Sanhua Holding GroupDec 2025 – Mar 2026

AI Engineer Intern · Digital AI Division · Hangzhou

Integrated dual LLM APIs (OpenAI + DeepSeek) for internal knowledge Q&A prototype; designed prompt templates and response parsing workflows
Cleaned ~10K equipment logs and supply chain records with Python/pandas for downstream AI/ML pipelines

Penn Medicine · University of PennsylvaniaNov 2025 – Mar 2026

Research Assistant — AI4ClinicalPsychology Lab

Built multimodal ML pipeline: video → feature extraction (MediaPipe/OpenSMILE) → emotion classification → LLM-based therapist evaluation; automated 3,000+ video samples
Conducted meta-analysis of 20+ clinical studies using Covidence to identify treatment efficacy moderators

Stanford Psychophysiology LabSep 2025 – Present

Research Assistant · EMA-Sleep-Diary-Data-Cleaning-Pipeline ↗

Engineered 4-layer auditable R pipeline processing 10K+ participants, extracting 7 core sleep behavior metrics
Developed three-stage parsing framework (decision tree + temporal correction) resolving noisy free-text and timestamp anomalies

Zhejiang Univ. of Sci & TechMar 2024 – Mar 2026

Research Technician · Social Psych Lab

Built analysis pipeline for 1,070 survey responses; designed PsychoPy experiments on AI trust and decision-making
Co-authored manuscript submitted to Journal of Applied Social Psychology

WashU Speech & Hearing LabJan 2025 – Present

Research Assistant

Quantifying lexical difficulty and modeling bilingual phonological permeability to explain cross-linguistic interaction patterns

Projects

Multimodal Clinical Emotion Recognition Pipeline

Python · MediaPipe · OpenSMILE · Py-Feat · LLM Eval Layer

End-to-end system: raw video → facial + acoustic feature extraction → ML classification → LLM-based evaluation. Automated 3,000+ video assessments for Penn Medicine.

ClinicalBERT Trauma Text Classification

HuggingFace · ClinicalBERT · PyTorch

Fine-tuned ClinicalBERT for clinical trauma text classification achieving F1=0.84. Designed stratified sampling to address class imbalance.

Education

Yonsei University

B.S. Applied Statistics · B.A. Philosophy (double major)
Minor: English Language & Literature

2023 – 2027 (expected)

GPA: 3.89/4.3

Washington University in St. Louis

Exchange · Philosophy-Neuroscience-Psychology track

Jan 2025 – May 2025

GPA: 3.75/4.0

Publications

Underestimation of Others' Attitudes Toward AI: Implications for AI Adoption — Third author; Journal of Applied Social Psychology

Perceived Economic Inequality Inhibits Pro-Environmental Engagement — Third author; British J. Social Psychology, 64(2), e12815

Predicting Next-Day Suicidal Urges via EMA and Passive Sensing — Poster presentation, ABCT 2025 Annual Convention

NEURAL FEATURES OF SPEECH-IN-NOISE (SIN) PERCEPTION DEFICITS AFFECTING SOCIAL COOPERATION AMONG COLLEGE STUDENTS: AN FNIRS HYPERSCANNING STUDY — Poster presentation, CUHK SURP

Activities & Honors

AYUI — Yonsei Undergraduate Immunologists Association

Jinri (진리) Scholarship — Yonsei University (awarded twice)

Secret Book Club — English literature & wine tasting society

PKU Peiwen Cup — National 2nd Prize in Literary Writing (2018)

研究与实践经历

三花控股集团2025.12 – 2026.03

AI 工程实习生 · 数字化AI事业部 · 杭州

集成 OpenAI + DeepSeek 双 LLM API，设计提示模板与响应解析流程，构建内部知识问答原型系统
使用 Python/pandas 清洗约 10,000 条设备日志及供应链数据，为下游 AI/ML 管道提供高质量数据集

宾夕法尼亚大学医学院2025.11 – 2026.03

研究助理 — AI4ClinicalPsychology Lab

构建多模态机器学习管道：视频 → 特征提取（MediaPipe/OpenSMILE）→ 情绪分类 → 基于 LLM 的治疗质量评估；自动化处理 3,000+ 临床视频样本
使用 Covidence 对 20+ 临床研究进行元分析，识别治疗效果的关键调节变量

斯坦福大学心理生理学实验室2025.09 – 至今

研究助理 · EMA-Sleep-Diary-Data-Cleaning-Pipeline ↗

构建四层可审计 R 语言数据管道，处理 10,000+ 参与者数据，提取 7 项核心睡眠行为指标
开发三阶段解析框架（决策树 + 时间校正算法），解决自由文本噪声和时间戳异常问题

浙江科技大学 · 社会心理学实验室2024.03 – 2026.03

研究技术员

构建 1,070 份问卷的全分析管道；独立设计 PsychoPy 行为实验，研究 AI 信任与决策机制
合著论文已提交至 Journal of Applied Social Psychology

项目精选

多模态临床情绪识别管道

Python · MediaPipe · OpenSMILE · Py-Feat · LLM 评估层

端到端系统：原始视频 → 面部表情 + 声学特征提取 → ML 分类 → LLM 评估。为宾夕法尼亚大学医学院构建自动化 3,000+ 视频评估管道。

ClinicalBERT 创伤文本分类

HuggingFace · ClinicalBERT · PyTorch

微调 ClinicalBERT 实现临床创伤文本分类，F1 达 0.84。设计分层采样解决类别不平衡问题。

教育背景

延世大学

应用统计学理学士 · 哲学文学士（双学位）
辅修：英语语言文学

2023 – 2027（预期）

GPA: 3.89/4.3

圣路易斯华盛顿大学

交换项目 · 哲学-神经科学-心理学方向

2025.01 – 2025.05

GPA: 3.75/4.0

论文发表

对他人 AI 态度的低估：对 AI 采纳的影响 — 第三作者；Journal of Applied Social Psychology

感知经济不平等抑制亲环境行为 — 第三作者；British J. Social Psychology, 64(2), e12815

基于 EMA 与被动感知的次日自杀冲动预测 — 海报展示，ABCT 2025 年会

噪声下言语感知缺陷影响大学生社会合作：一项 fNIRS 超扫描研究 — 海报展示，CUHK SURP

活动与荣誉

AYUI — 延世大学本科生免疫学会

真理（진리）奖学金 — 延世大学（两次获得）

秘本读书会 — 英国文学与红酒品鉴社团

北京大学培文杯 — 文学写作全国二等奖（2018）

경력

Sanhua Holding Group (삼화홀딩스)2025.12 – 2026.03

AI 엔지니어 인턴 · 디지털AI사업부 · 항저우

OpenAI + DeepSeek 듀얼 LLM API 통합하여 내부 지식 QA 프로토타입 구축; 프롬프트 템플릿 및 응답 파싱 워크플로 설계
Python/pandas로 약 10,000건의 장비 로그 및 공급망 데이터 정제하여 AI/ML 파이프라인에 공급

펜 의과대학 · University of Pennsylvania2025.11 – 2026.03

연구보조원 — AI4ClinicalPsychology Lab

멀티모달 ML 파이프라인 구축: 비디오 → 특징 추출(MediaPipe/OpenSMILE) → 감정 분류 → LLM 기반 치료 평가; 3,000+ 비디오 샘플 자동화
Covidence를 활용한 20+ 임상 연구 메타분석을 통해 치료 효과 조절 변수 식별

스탠포드 정신생리학 연구소2025.09 – 현재

연구보조원 · EMA-Sleep-Diary-Data-Cleaning-Pipeline ↗

4계층 감사 가능한 R 파이프라인 구축, 10,000+ 참가자 데이터 처리, 7개 핵심 수면 행동 지표 추출
3단계 파싱 프레임워크(의사결정나무 + 시간 보정) 개발로 자유 텍스트 노이즈 및 타임스탬프 이상 해결

절강과학기술대학교 · 사회심리학연구소2024.03 – 2026.03

연구 기술원

1,070건 설문 응답 분석 파이프라인 구축; AI 신뢰도 및 의사결정 연구를 위한 PsychoPy 실험 설계
공동 저술 논문 Journal of Applied Social Psychology에 제출

WashU 언어청각연구소2025.01 – 현재

연구보조원

어휘 난이도 정량화 및 이중언어 음운 투과성 모델링을 통한 교차언어 상호작용 패턴 분석

프로젝트

멀티모달 임상 감정 인식 파이프라인

Python · MediaPipe · OpenSMILE · Py-Feat · LLM 평가 레이어

엔드투엔드 시스템: 원본 비디오 → 얼굴 표정 및 음향 특징 추출 → ML 분류 → LLM 기반 평가. Penn Medicine에서 3,000+ 비디오 평가 자동화.

ClinicalBERT 외상 텍스트 분류

HuggingFace · ClinicalBERT · PyTorch

ClinicalBERT 미세조정으로 임상 외상 텍스트 분류, F1=0.84 달성. 클래스 불균형 해결을 위한 계층적 샘플링 설계.

학력

연세대학교

응용통계학 이학사 철학 문학사(복수전공)
부전공: 영어영문

2023 – 2027 (예정)

GPA: 3.89/4.3

Washington University in St. Louis

교환학생 · 철학-신경과학-심리학 트랙

2025.01 – 2025.05

GPA: 3.75/4.0

논문

타인의 AI 태도에 대한 과소평가: AI 도입에 대한 함의 — 제3저자; Journal of Applied Social Psychology

인지된 경제적 불평등이 친환경 행동을 저해한다 — 제3저자; British J. Social Psychology, 64(2), e12815

EMA 및 패시브 센싱을 활용한 다음 날 자살 충동 예측 — 포스터 발표, ABCT 2025 학술대회

잡음하에서의 언어인식 결함이 대학생 사회협력에 미치는 영향: fNIRS 초스캐닝 연구 — 포스터 발표, CUHK SURP

활동 및 수상

AYUI — 연세대학교 학부 면역학회

진리 장학금 — 연세대학교 (2회 수혜)

The Secret Book Society — 영문학 & 와인 동아리

북경대학교 배문컵 — 문학창작 전국 2등상 (2018)

GitHub Repositories

Loading repositories