职位描述
职位描述: 职位描述:负责指定网站的网页抓取、数据提取、清洗、入库。负责系统日常运营资源调度优化及运营指标分析调优,并能实时监控爬虫的进度和警报反馈。负责爬虫核心系统,数据平台的研发维护、信息抽取、搜索、挖掘相关技术研发。相关系统分布式计算等技术研发工作;相关系统流程、性能持续优化工作; 任职资格:具有扎实的计算机操作系统及体系结构基础;扎实的算法及数据结构基础知识,熟悉常用搜索引擎原理、推荐算法有实际工作经验的优先考虑;熟悉面向对象软件设计方法,掌握java/C++,熟悉脚本语言(如python),熟悉在unix环境开发;理解Spring框架,并有实际开发或应用扩展的工作经验;熟悉MySQL,掌握常用ORM框架,并在实际工作项目中运用;熟悉常用NoSQL开源软件、系统;具有海量数据处理、高性能计算、大规模分布式系统开发等方面经验者优先;具有语义分析、语义搜索相关的经验者优先;联系时,请记得是在“job669人才”看到的!