招聘中

数据与自动化工程师 15k-25k

职位性质
远程全职
工作地点
远程工作
职位分类
职位标签
AI   爬虫   自动化  

职位描述

岗位概述
我们在找一位务实、能落地的爬虫自动化数据工程师,负责搭建和维护支撑商业决策的数据管线。在这个角色里,你将全权负责大规模外部数据的端到端获取——从设计高可用的中文站点爬虫,到搭建自动化工作流,把干净、结构化的数据对接到内部系统。你的工作将直接影响商业决策,确保我们能稳定获取来自企业信息公示平台、电商平台和监管渠道的关键商业数据。你需要在技术执行的同时,理解并尊重中国数据采集合规与运营环境的现实边界。

 

核心职责
爬虫与数据采集(约 60%)

  • 设计、开发并维护面向各类中文数据源(如天眼查、政府采购平台等)的高可用、可扩展爬虫管线。
  • 持续迭代反爬对抗策略,包括但不限于代理/IP 轮换、请求频率控制、浏览器指纹管理和验证码处理。
  • 从 HTML、JS 渲染页面(无头浏览器)、API、PDF 及其他非结构化格式中解析并提取结构化数据。
  • 构建完善的监控、日志和告警体系,确保爬虫健康度与数据时效性。
  • 持续关注国内网络爬虫的技术与法律环境变化,确保所有采集活动在《个人信息保护法》(PIPL)、《数据安全法》(DSL)及平台用户协议框架内运行。

 

工作流自动化与编排(约 40%)

  • 以 OpenClaw(或同类工具)为核心编排层,定义、调度和管理复杂的多步骤数据采集与自动化工作流。
  • 搭建自动化管线,将爬取的数据对接到下游系统,包括数据库、数据仓库、内部 API 及可视化看板。
  • 实现容错工作流逻辑,包括异常处理、自动重试、条件分支和失败告警。
  • 与数据分析师及产品团队紧密配合,理解业务需求,将手动取数与处理流程自动化,提升整体运营效率。
  • 为所有负责的系统撰写数据字典、数据字典表、管线设计文档及运维手册。

 

硬性要求

  • 1–5 年数据工程、爬虫或自动化相关实战经验。
  • 熟练使用 Python 或 Go 进行数据抓取与自动化开发,深入掌握 Playwright / Selenium、BeautifulSoup、lxml、requests 等常用库。
  • 具备大规模爬虫实战经验:深入理解 HTTP/HTTPS、会话机制、Cookie、浏览器开发者工具及现代反爬虫对抗技术。
  • 有 OpenClaw 或同类 RPA / 工作流编排工具(如 Apache Airflow、n8n、UI.Vision)的实操经验,能独立完成流程搭建、调度与监控。
  • 深度熟悉中文互联网生态,了解主流站点的页面结构与访问策略、百度搜索行为特征及国内常见的反爬技术方案。
  • 熟悉 SQL 数据库(PostgreSQL / MySQL)及云存储(S3 / OSS)的数据接入与管线搭建。
  • 掌握 Docker 容器化技术,能在容器化或云环境中部署和维护爬虫。
  • 了解国内相关数据法规(PIPL《个人信息保护法》、DSL《数据安全法》),具备良好的数据伦理与合规意识。
  • 具备英文读写能力,能与海外团队顺畅沟通。

 

加分项

  • 熟悉国内常用的代理服务商及代理管理平台。
  • 英语口语流利是加分项,非必须。
  • 有创业公司或中小企业历练,适应高ownership、快迭代的务实风格。

 

技术栈

  • 主力语言:Python / Go
  • 爬虫与浏览器自动化:Playwright、Puppeteer、Selenium、BeautifulSoup、Scrapy
  • 工作流编排:OpenClaw、Apache Airflow
  • 数据存储:PostgreSQL、S3 或同类 / 阿里云 OSS
  • 基础设施:Docker、Git、Linux
  • 代理与基础设施:各类住宅代理 / 数据中心代理网络

 

我们提供

  • 有竞争力的薪酬(视经验与能力可谈)¥15K+
  • 弹性工作安排(REMOTE POLICY – 需要base在上海/深圳/北京)
  • 学习预算与专属学习时间,支持技能成长

 

关于投递简历、咨询、与面试详情
面试全程线上完成。简历通过后,我们会邮件约您线上面试。
视情况可能安排一个简单的 take-home task。

如果你对这个岗位感兴趣,请附上简历和期望薪资发送邮件至联系方式
如有任何其他疑问,欢迎添加微信咨询

如何申请

Enquiry via wechat: atomkwk

推荐职位

急招
百度或谷歌SEO
15k-25k 远程全职/兼职 远程工作

3年以上 SEO 

方向:百度搜索引擎 | 近半年内有建站案例

岗位职责
1.制定并执行百度 SEO 优化方案,涵盖站内内容优化、结构优化及外链建设全链路。
2.进行关键词挖掘与布局,制定内容策略并落地执行,持续提升核心关键词排名与自然流量。
3.分析竞争对手 SEO 策略,结合百度算法动态,制定针对性优化方案。
4.基于百度统计、站长平台等工具的数据反馈,独立完成流量效果分析并撰写优化报告。
5.监控网站健康状态与核心数据指标,识别并处理异常问题,保障站点稳定运营。

岗位要求
工作经验:3 年及以上国内搜索引擎优化工作经验,重点侧重百度搜索引擎;近半年内有完整建站实操案例,可展示实际成效。熟悉以下一种或多种站型的运营与优化:单站、泛站、影视站、镜像站,有 X 站经验者优先。
技术 SEO:理解站点架构、robots.txt、sitemap 配置、页面加载速度优化及移动端适配;熟悉 HTML、CSS、PHP 等前端代码;了解网站底层结构者优先。
关键词与内容策略:熟练运用 5118 等工具进行关键词挖掘与布局;能制定内容策略并落地执行,覆盖站内内容优化、结构优化及外链建设全链路。
主流 SEO 工具:熟练使用百度统计、百度站长平台、5118、爱站等主流平台与分析工具,能基于数据反馈持续调整优化策略。
数据分析:具备扎实的数据分析能力,能独立完成流量效果评估,并撰写清晰、可执行的 SEO 优化报告。
核心素养:耐心细致,能长期专注深耕;持续学习与迭代优化;结果导向。

加分项
具备蜘蛛池运营经验;有必应等多搜索引擎 SEO 实操经验;近期持有高权重网站;对百度算法更新有敏锐洞察,具备风险预判能力;有 Python / Shell 脚本开发经验。

1–3 年 Google SEO

方向:海外独立站 / 外贸站 | 能力侧重:GA4 + GSC 数据分析

岗位职责
1.制定并落地 Google SEO 优化方案,提升核心关键词自然排名与品牌曝光度。
2.深度分析竞争对手 SEO 策略,识别差距与机会,制定针对性的超越方案。
3.系统优化英文网站结构、页面内容与内部链接体系,提升整体抓取效率与用户体验。
4.主动拓展高质量外部链接资源,持续提升域名权威度(Domain Authority)。
5.实时监控网站健康状态与核心数据指标,定期输出优化分析报告,驱动决策迭代。

加分项
具备 HTML / CSS / JS 基础代码能力;有 Google 算法更新快速响应经验。

如何申请

邮箱:Leed79211@gmail.com Telegram:@foya_90

[岗位描述]:

完成老师指定的内容,包括幼,小,初,高各阶段:教学设计、微课脚本、其他相关文稿(说课稿,逐字稿,教学案例等)

[岗位要求]:

1.有较强学习能力,有责任心,守时,诚信,有一定沟通能力。

2.可接受无经验,但需要通过公司笔试,笔试附学习资料,无经验者可学习后通过。

[薪酬及时间]:

每单按字数结算,根据难度以及编辑老师的水平,30-70元/千字不等;

前3单每单结束后结算;后续每周结算,多劳多得。

在家自由办公,自行安排时间,但务必在客户要求的时间内完成。

[入职方式]

通过笔试。

如何申请

发送“笔试”至邮箱:miranda2024ht@126.com,会回复笔试资料和题目,一周内将笔试以及你可联系的微信号回复至该邮箱即可。

公司名称
Favorite Medium
公司介绍
Favorite Medium 是一家成立多年的数字产品设计与工程咨询公司,总部在海外,团队分布全球,主要业务在韩国、日本、香港等地。我们专注于帮助企业从0到1设计、开发并上线数字产品,涵盖产品策略、UI/UX设计、软件开发、数据工程、AI、及web3等领域。
将职位分享到
远程.work-远程工作招聘网站
职位订阅
微信扫码关注微信服务号