崗位職責:
1、負責網頁信息抽取技術的研究和開發;
2、負責爬蟲各個系統核心代碼開發;
3、提高數據抓取的效率和質量,解決數據的重復,垃圾數據識別,清洗;
4、提高系統的可運維,可測性,易用性。
任職要求:
1、3年以上python或java開發經驗;
2、熟悉MYSQL,MSSQL,具備sql調優經驗;
3、了解爬蟲的設計及實現流程;
4、了解HTML基礎知識;
5、具備團隊協作精神;
6、了解文本分類,統計分析,自然語言處理,機器學習算法,熟悉前端技術和分布式計算,有分布式存儲經驗者優先。
聯系我時,請說是在廣州校園網上看到的,謝謝!