最新爬虫远程工作招聘信息

Python工程师
5k-10k 远程实习 支持亚太/北美时区远程
职位详情

岗位职责:

  • 负责大规模文本和图像数据的抓取和维护;
  • 负责文本和图像数据的结构化信息的提取、质量分析和清洗工作;
  • 利用机器学习模型,对数据进行清洗,提取需要的信息,并对数据集进行优化,提高数据集的质量。

岗位要求:

  • 全日制本科及以上学历,计算机、软件工程等相关专业优先;
  • Python编程方面有丰富经验,能够编写高质量代码和文档,并熟悉面向对象编程以及常见的Python运行效率优化方式;
  • 熟悉使用ChatGPT等AI生产力工具,并能利用这些工具快速掌握新的技术栈;
  • 有bash脚本或其他批处理脚本编写经验,以及独立开发通用爬虫框架的能力者优先;
  • 熟悉常用数据库操作(如MongoDB/PostgreSQL),并有使用pandas、jupyter等数据分析工具的经验者优先;
  • 有使用AWS的经验者优先;
  • 对各类游戏和二次元文化有浓厚兴趣,有使用ACG资源站点的经验者优先;
  • 具备优秀的分析能力和学习能力;
  • 有强烈的责任心和团队精神,善于沟通和协作。

如何申请

职位详情

招聘长期合作的兼职后端工程师,和我们一起完成定制化的电商解决方案的具体实现

如何申请

爬虫/数据工程师
5k-10k 远程实习 远程工作
职位详情

About GrowthBox Research

增长黑盒 Research 是一家以数据和情报学驱动的增长策略研究机构,致力于为全球企业和投资机构提供增长策略咨询、Competitive Intelligence、另类数据服务等。我们服务的客户包括:国内一线美元 /人民币基金、国际顶级奢侈品集团、国内一线互联网大厂等。

你将负责什么?

负责爬虫系统的开发、维护与优化

设计数据采集策略,提升数据采集效率及质量

对数据内容敏感,热衷探索并实践前沿爬虫技术与存储技术

我们需要你会:

热爱技术,拥有优秀的代码能力,快速学习能力

拥有 python 爬虫经验,掌握 web/app/小程序的数据采集方法

了解反爬虫策略和应对经验

熟悉后端数据库存储和维护

良好的英文水平,可流畅阅读国外开发文档

你将在这里:

在超棒的办公环境里,和一群有趣的同事,一起挖掘最前沿的 Growth Hacking 策略,你还将被训练以刑侦学驱动的深度分析事物的方法与逻辑。

适合什么样的人加入?

对新鲜事物具有强烈的好奇心,高度自我驱动型人格,善于钻研解决问题。

如何申请