简历

项目展示

作为一名数据科学和分析专业的学生,我在课程和独立项目中积累了丰富的实战经验。以下是我参与的几个代表性项目,涵盖了机器学习模型应用、时间序列分析以及自动化数据处理等多个领域。

机器学习:客户反馈数据分析与智能分类

该项目围绕CFPB(消费者金融保护局)客户投诉数据展开,涵盖数据收集、清洗、可视化及探索性分析(EDA)、无监督学习和监督学习。由于用户自行标注的投诉类别可能存在偏差,我们重点关注投诉文本,以挖掘实际需求。在无监督学习部分,我们使用TFIDF和BERT向量化处理文本数据,采用多种降维及聚类方法,探索数据的自然分类方式。在监督学习部分,我们基于标注数据训练模型,预测投诉类别和情感倾向,助力自动化决策,优化投诉处理策略,为监管机构和金融公司提供智能化支持。

查看报告

时间序列分析:美元指数的波动分析与预测

该项目旨在分析美元指数(DXY)随时间的波动,探讨其对美国及全球经济的影响,以及预测美元指数的长期趋势。通过对时间序列数据的分析,我们深入研究了美元强弱变化如何影响各个经济领域,为市场参与者提供关于美元变化的重要洞察。

查看报告

美债市场运行机制解析

该报告为科普向。为系统地理解美债当前所面临的结构性风险与未来可能走向,本文从三方面展开分析:一是美债市场的三类关键参与者及其作用机制;二是美债收益率的核心决定因素及其市场传导逻辑;三是近年来影响美债市场的重要事件与政策演变。希望借此帮助大家构建对美债市场的清晰认识。

查看报告

数据可视化:全球安全事件与人道援助风险分析

该项目基于全球安全事件数据,利用R语言(dplyr、lubridate)和Plotly等工具进行数据整理与交互式图表展示。项目中构建了时序图、动画地图、动态散点图和堆叠柱状图,全面揭示了安全事件的时间趋势、地理分布以及不同攻击手段和救援组织面临的风险差异。通过多角度的数据探索与可视化呈现,本项目为理解全球安全形势和制定应急响应措施提供了直观、可靠的数据支持。

查看报告

自动化数据处理与网站部署

该项目主要聚焦于使用 Python 和 Bash 脚本自动化数据处理任务,并通过 Quarto 构建并部署静态网站。本项目创建了一个自动化工作流,处理图像数据并生成洞察,使用面向对象编程(OOP)结构化代码,结合云存储和 GitHub 提交,保证代码版本控制和自动同步。

查看报告

联系方式

以下是我的联系方式,欢迎随时联系我: