租房信息專(zhuān)業(yè)搜索引擎項目計劃書(shū)
商業(yè)計劃書(shū)有相對固定的格式,它幾乎包括反映投資商所有感興趣的內容。下面是關(guān)于租房信息專(zhuān)業(yè)搜索引擎項目計劃書(shū)的內容,歡迎閱讀!
一、項目開(kāi)發(fā)背景
衣食住行一直是社會(huì )人賴(lài)以生存和生活的幾大要素。隨著(zhù)當今社會(huì )快速的現代化和城市化,衣、食、行等方面的問(wèn)題已經(jīng)變得十分的容易和便捷,但是,住的問(wèn)題卻猶如一座大山,壓在我們的肩頭,讓我們感覺(jué)越來(lái)越沉重。
在一個(gè)現代化的城市中,除去原住民,除去富裕得足以買(mǎi)得起一座房子的和能夠幸運的得到公司或者單位分房的人,其余的相當大的一部分人基本上要靠租房來(lái)解決住的問(wèn)題。但是,實(shí)際中關(guān)于住房出租的信息,稀少而且混亂,對于一個(gè)急切想要租到一套適合自己需求的住房的人來(lái)說(shuō),這顯然是十分困難和不便的。
有租房需求的主要是這樣一些群體:剛剛開(kāi)始工作的尚無(wú)多少積蓄的工薪階層;已工作多年但是仍無(wú)力購買(mǎi)任何形式住房的低收入階層;準備考研或其它各種考試的部分大學(xué)生群體;相當一部分的研究生群體。這些人占據了城市生活的相當重要的一角。另一方面,隨著(zhù)信息技術(shù)的飛速發(fā)展,人們早已習慣于在網(wǎng)上找尋自己需要的信息,尤其是通過(guò)搜索引擎來(lái)從海量的信息中提取自己關(guān)注的部分。結合上面兩部分因素,我們便自然的產(chǎn)生了開(kāi)發(fā)這樣一個(gè)租房信息的專(zhuān)業(yè)搜索引擎的想法,主要是為了服務(wù)于相當一部分的有租房需求的人群。
二、項目需求分析
1、系統目標
本系統的目標就是:為所有需要獲取租房信息的人,提供最全面的信息,最便捷的方式,使得網(wǎng)絡(luò )搜索引擎真正成為最值得信賴(lài)的信息來(lái)源。這里的租房信息可以包括網(wǎng)絡(luò )上現有的所有比較可靠的網(wǎng)站和論壇上發(fā)布的信息,也包括和本搜索引擎具有合作關(guān)系的房產(chǎn)中介所提供的信息。這些信息原本散布于各個(gè)網(wǎng)站的邊角或者張貼于大街小巷的隱蔽位置,本系統正是需要有效的整合這些渠道的各種信息,最大可能的提供最有價(jià)值的租房信息。
本系統的提出主要針對傳統租房信息獲取渠道的不便捷性,即:需要耗費大量的精力和物力來(lái)獲取信息,以及現有網(wǎng)絡(luò )租房信息獲取渠道的不完備性,即:信息的.非有效性整合和信息的分布不一致性。同時(shí),本系統又吸收先有信息渠道的長(cháng)處,做以擴展。
2、系統功能
(1)信息的抓取
從我們關(guān)注的可能會(huì )發(fā)布租房信息的網(wǎng)站和論壇抓取它們的網(wǎng)頁(yè),并以一定格式提取抓下來(lái)的網(wǎng)頁(yè)中的有效信息。
(2)信息的處理和存放
對于提取來(lái)的文本信息,進(jìn)行切分分詞、添加標簽、詞頻統計,并據此建立全文索引。
(3)信息的檢索
接收用戶(hù)輸入的搜索條件,對其進(jìn)行分析處理,然后在索引中進(jìn)行查詢(xún)匹配,從本地數據庫中提取所有符合條件的信息。
(4)返回結果給用戶(hù)
將提取的信息排序后,以結果頁(yè)面的形式呈現給用戶(hù)。
3、系統性能要求
(1)響應時(shí)間
系統的響應速度應該在用戶(hù)可接受的范圍之內,至少與現有各種搜索引擎相當。這點(diǎn)要求我們必須建立結構合理的索引以及設計高效準確的查詢(xún)、搜索算法。
(2)結果的準確性和合理性
對于用戶(hù)輸入的搜索條件,返回的結果應該盡可能的和他期望的保持一致,并且越接近的余越應先被用戶(hù)看到。這涉及到網(wǎng)頁(yè)信息提取、索引建立、條件匹配、結果排序等問(wèn)題。
(3)時(shí)效性
用戶(hù)希望看到的是越新的信息越好,過(guò)時(shí)的租房信息對于用戶(hù)來(lái)說(shuō)沒(méi)有價(jià)值或者只有很小的參考價(jià)值。這要求我們盡可能頻繁的對網(wǎng)站進(jìn)行抓取,然后分析,另一方面,在將結果呈現給用戶(hù)的時(shí)候,排序也要考慮到時(shí)間因素,即越新的信息要越排在前面。
(4)靈活性
系統要有良好的接口,便于后面的擴充,以適應信息源的增加或者減少;要留有服務(wù)器接口,以實(shí)現后面服務(wù)器功能的需要;要具有跨平臺功能。
(5)其它
要求用戶(hù)界面友好,運行穩定。
三、項目開(kāi)發(fā)計劃
1、開(kāi)發(fā)規模計劃
由于本項目是作為課程作業(yè)來(lái)做的,受到時(shí)間和人力等方面的約束,我們在實(shí)際開(kāi)發(fā)中只能減小問(wèn)題的規模,開(kāi)發(fā)一個(gè)demo程序的原型系統。初步計劃是,抓取網(wǎng)頁(yè)只在北大未名和水木清華兩大bbs的相關(guān)版面進(jìn)行。在此基礎上進(jìn)行網(wǎng)頁(yè)信息的提取,分詞,建立索引,然后實(shí)現對輸入關(guān)鍵詞的解析,匹配查詢(xún),結果排序,返回到頁(yè)面顯示等工作,從而完成概念上的實(shí)現,給出初步的系統原型。
2、初步開(kāi)發(fā)計劃
(1)界面
類(lèi)似于baidu和google的界面,用戶(hù)可以輸入搜索條件,點(diǎn)擊搜索按鈕后,下面排列出符合條件的結果。稍微不同的是,由于租房信息跟地域(城市、地區)緊密相關(guān),所以在用戶(hù)輸入搜索條件前,要先讓用戶(hù)選定一個(gè)地區,然后再進(jìn)行搜索。這里我們僅考慮北京市城區。
(2)后臺
初步考慮分為以下幾個(gè)模塊:
A.網(wǎng)頁(yè)抓取模塊:對北大未名和水木清華兩大bbs相關(guān)版面,利用crawler進(jìn)行抓取。
B.網(wǎng)頁(yè)分析模塊:提取網(wǎng)頁(yè)中有用的信息,保存為文本格式。
C.網(wǎng)頁(yè)分段模塊:采用合適的分段技術(shù),將每個(gè)文本分成多段。
D.索引建立模塊:對分好的段進(jìn)行分詞、標注、詞頻統計等工作,建立全文索引。
E.查詢(xún)匹配:將用戶(hù)輸入的關(guān)鍵詞,采用合適的查找算法與索引進(jìn)行逐一匹配,將符合的內容提取出來(lái),返回到界面。
F. 排序:考慮相似度和時(shí)間等因素,將結果越接近,時(shí)間越新的內容排到前面。
【租房信息專(zhuān)業(yè)搜索引擎項目計劃書(shū)】相關(guān)文章:
項目計劃書(shū)包括12-20
項目融資計劃書(shū)10-11
網(wǎng)站項目計劃書(shū)08-22
項目還款計劃書(shū)08-21
培訓項目計劃書(shū)范文08-12
項目計劃書(shū)(15篇)12-20
項目融資計劃書(shū)范文12-18
竹炭竹筷項目計劃書(shū)12-15
融資項目計劃書(shū)模板12-13
農業(yè)扶貧項目計劃書(shū)12-13