?

南方報業傳媒集團南方網系統開發技術及數據采集服務項目采購公告

2019-06-12 11:37:04 
一、項目名稱
南方報業傳媒集團南方網系統開發技術及數據采集服務項目
二、項目簡介
南方報業傳媒集團南方網為配合云平臺數據庫建設工作,服務于雙創政策數據庫建設,需采購系統開發技術服務,包括政策數據采集及新聞網站數據采集技術服務。采集內容約991個數據源,需具有數據篩選及分析功能,滿足數據庫建設的使用功能,現公開詢價。
三、合格供應商(同時滿足以下條件)
1、在中國境內注冊成立的,具有獨立法人資格的企業;
2、提供資訊新聞大數據采集服務項目案例。
3、可提供增值稅專用發票。
4、不接受聯合體競價、分包、轉包。
四、服務要求
1.數據來源有991個,主要為國內公開出版發行的報紙、網站、社交平臺數據,包括各公開政策、文件、規劃、措施、制度和關于政策、項目各方需求的資訊等。
2.抓取的規則:見附件1
3.抓取的時間:從公開的全網已有的歷史數據開始抓取,直至現在。
4.服務時間:合同期一年。
5.抓取的數據量:第一批需要爬取的數據含歷史數據及更新至目前的數據約22萬條,之后將視各數據源更新情況而定。
6.抓取的內容:
(1)目標數據源清單,進行相應字段的提取,包括標題、公文號、摘要、關鍵詞、正文、政策目錄、發布機構、行政層級、發布區域、發布時間、政策領域、公文類型、附件、政策解讀等。
(2)來源標題、發布時間、來源正文、資訊內容、回復內容、來源鏈接、摘要、關鍵詞、發布來源、唯一ID等。
7、數據處理方式:通過爬蟲等技術把全網的歷史數據及實時更新的數據進行爬取,并進行數據清洗處理為半結構化數據,采用接口方式實時向我方進行推送。
8、交付方式:服務商在規定的時間內完成項目所需的字段提取,經雙方確認數據接口正常使用及數據內容質量穩定后,視為驗收合格。
9、其他要求見合同主要條款:見附件2
五、報價要求
符合條件且有興趣參與本項目的服務商,請下載本公告附件3南方報業傳媒集團南方網系統開發技術及數據采集服務項目的報價函》,按照該函的要求填寫并附相關材料,加蓋公章后,于 2019年6月17日17時 之前將報價函密封(封口加蓋騎縫章,并在外面注明項目名稱和聯系方式)后送至或快遞到我集團物資采購部,地址:廣州市廣州大道中289號南方報業傳媒集團1號樓15樓,聯系人:黃先生(18613198938)或藍先生(13632286082)。
 
                                                                                                                             南方報業傳媒集團物資采購部

                                                                                                                                        2019年6月11日
 附件

附件1:數據字段爬取規則說明

附件2:主要合同條款

附件3:系統開發技術及數據采集項目報價函
双色球17037期杀红球