01.关于我
我是一名 AI 应用工程师,专注于将前沿的人工智能技术落地为实际产品。在语音识别领域,我基于 Whisper 模型的 Encoder 层结合多层感知机(MLP),训练文本与音频的评分任务模型,积累了丰富的多模态建模经验。
同时,我熟悉大语言模型 API 的开发与集成,能够快速构建基于 LLM 的智能应用。我热衷于探索 AI 技术的边界,将复杂的模型能力转化为用户可感知的产品价值。
PythonPyTorchWhisperLLM APIFastAPITransformers
🤖
02.技能
Python95%
PyTorch / Transformers85%
Whisper / ASR85%
LLM API 开发90%
FastAPI / 后端80%
数据处理 / 特征工程80%
03.项目
01→
视频翻译系统
基于 Whisper Encoder + MLP 的音频文本评分模型,实现视频语音识别与多语言翻译的端到端流水线。
WhisperPyTorchFFmpeg
02→
音频质量评分模型
利用 Whisper Encoder 提取音频特征,结合多层感知机对文本与音频进行匹配度评分,用于语音合成质量评估。
TransformerMLPPython
03→
LLM 智能应用平台
基于大模型 API 构建的智能对话与内容生成平台,支持流式输出、Prompt 管理与多模型切换。
LLM APIFastAPIReact