职位描述
岗位职责:
-
负责大规模文本和图像数据的抓取和维护;
-
负责文本和图像数据的结构化信息的提取、质量分析和清洗工作;
-
利用机器学习模型,对数据进行清洗,提取需要的信息,并对数据集进行优化,提高数据集的质量。
岗位要求:
-
全日制本科及以上学历,计算机、软件工程等相关专业优先;
-
在Python编程方面有丰富经验,能够编写高质量代码和文档,并熟悉面向对象编程以及常见的Python运行效率优化方式;
-
熟悉使用ChatGPT等AI生产力工具,并能利用这些工具快速掌握新的技术栈;
-
有bash脚本或其他批处理脚本编写经验,以及独立开发通用爬虫框架的能力者优先;
-
熟悉常用数据库操作(如MongoDB/PostgreSQL),并有使用pandas、jupyter等数据分析工具的经验者优先;
-
有使用AWS的经验者优先;
-
对各类游戏和二次元文化有浓厚兴趣,有使用ACG资源站点的经验者优先;
-
具备优秀的分析能力和学习能力;
-
有强烈的责任心和团队精神,善于沟通和协作。