南開22春學(xué)期《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)【資料答案】

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2022-08-09 18:05:46來源:admin瀏覽: 38 次

22春學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)-00001

試卷總分:100  得分:100

一、單選題 (共 20 道試題,共 40 分)

1.如果使用Python的數(shù)據(jù)結(jié)構(gòu)來做類比的話,MongoDB中庫相當(dāng)于一個大字典,大字典里面的每一個鍵值對都對應(yīng)了一個集合,Key為(),Value就是一個集合。

A.字典

B.集合的名字

C.集合

D.文檔


2.Redis若要進(jìn)入交互環(huán)境,需要打開終端輸入()

A.redis-cli

B.redis

C.redis-cmd

D.redis-start


3.xpath中extract方法返回值類型是()

A.列表

B.元組

C.字典

D.集合


4.Scrapy自帶的待爬隊列是()

A.deque

B.queue

C.list

D.lqueue


5.請問按哪個鍵可以打開Chrome自帶的開發(fā)者工具()

A.F10

B.F1

C.F11

D.F12


6.服務(wù)器端記錄信息確定用戶身份的數(shù)據(jù)是

A.session

B.cookies

C.moonpies

D.localstorage


7.以下關(guān)于Charles的說法正確的是( )

A.Charles是一個跨平臺的HTTP抓包工具,可以截取HTTP或者HTTPS請求的數(shù)據(jù)包

B.Charles有Windows 32/64版和Linux 64 版,但是目前還沒有對Mac OS進(jìn)行有效的支持。

C.Charles上面滾動的數(shù)據(jù)就是目前計算機(jī)發(fā)起的數(shù)據(jù)包。單擊工具欄上面的黃色笤帚圖標(biāo),可以清停止抓包。

D.在Charles啟動時,系統(tǒng)自帶瀏覽器的部分HTTP流量不會經(jīng)過Charles。


8.MongoDB中數(shù)據(jù)存儲的形式類似于()

A.列表

B.元組

C.字典

D.集合


9.一般來說在頁面?zhèn)鬏數(shù)卿浶畔⒍加肏TTP()請求類型

A.GET

B.POST

C.PUT

D.SEND


10.使用了RedisSpider作為爬蟲的父類以后,爬蟲會直接監(jiān)控()中的數(shù)據(jù),并不讀取start_urls中的數(shù)據(jù)。

A.Redis

B.RedisSpider

C.Spider

D.MongoDB


11.當(dāng)需要把Python里面的數(shù)據(jù)發(fā)送給網(wǎng)頁時,需要先轉(zhuǎn)換成()字符串

A.Python

B.Json

C.正則表達(dá)式

D.Ajax


12.lxml庫中etree模塊的()方法把Selector對象轉(zhuǎn)換為bytes型的源代碼數(shù)據(jù)

A.etree.tostring

B.etree.convertBytes

C.etree.toBytes

D.etree.convertstring


13.Python中以下哪個容器里的元素不能重復(fù)()

A.列表

B.元組

C.字典

D.集合


14.通常使用()工具來模擬瀏覽器進(jìn)行爬蟲請求

A.Selenium

B.Chrome

C.ChromeDriver

D.WebDriver


15.下面Python代碼輸出為(): def default_para_trap(para=[], value=0): para.append(value) return para print('第一步:{}'.format(default_para_trap(value=100))) print('第二步:{}'.format(default_para_trap(value=50)))

A.第一步:[100] 第二步:[100,50]

B.第一步:[100] 第二步:[50]

C.第一步:[100] 第二步:[]

D.第一步:[100] 第二步:[100]


16.Python中若定義object=[1, 2, 3, 4, 5],則print(object[:3])輸出()

A.12

B.123

C.23

D.234


17.使用Xpath構(gòu)造屬性值包含相同字符串的路徑采用()方法

A.contain

B.contains

C.include

D.includes


18.使用UI Automatorr長按點擊的操作是得到相應(yīng)控件后使用命令()

A.longclick

B.long_click

C.clicklong

D.click_long


19.HTTP常用狀態(tài)碼表明服務(wù)器上沒有請求的資源的是()

A.500

B.503

C.403

D.404


20.Scrapy_redis是Scrapy的“()”,它已經(jīng)封裝了使用Scrapy操作Redis的各個方法

A.組件

B.模塊

C.控件

D.單元


二、多選題 (共 10 道試題,共 20 分)

21.Python中有哪些實現(xiàn)多線程方法()

A.multiprocess.dummy

B.threading.Thread

C.process

D.PyMongoDB


22.最常見的HTTP請求類型有()

A.GET

B.POST

C.SEND

D.RECEIVE


23.Redis中的值可以支持()

A.列表

B.哈希

C.集合

D.有序集合


24.常用的會話跟蹤技術(shù)是

A.session

B.cookies

C.moonpies

D.localstorage


25.以下哪種方法是MongoDB的查找方法()

A.find

B.find_one

C.finds

D.find_all


26.針對解析源代碼的BeautifulSoup對象,構(gòu)造時BeautifulSoup(網(wǎng)頁源代碼, '解析器')中的解析器可以為()

A.html

B.html.parser

C.lxml

D.xml


27.Python中一個函數(shù)可以有()個return語句

A.0

B.1

C.多個

D.2


28.Python中的容器有()

A.列表

B.元組

C.字典

D.集合


29.Python中一個函數(shù)沒有返回值則可以寫()

A.沒有return

B.return

C.return None

D.return NULL


30.下列關(guān)于在IOS上配置charles的說法正確的是()

A.不同ios設(shè)備之間會有比較大的差別,所以配置的時候需要找到對應(yīng)的安裝證書的入口。

B.手機(jī)和電腦需要在同一個局域網(wǎng)下。

C.HTTP代理可以使用“自動”選項。

D.安裝好證書以后,打開iOS設(shè)備上的任何一個App,可以看到Charles中有數(shù)據(jù)包在流動


三、判斷題 (共 20 道試題,共 40 分)

31.Python中使用下面代碼打開文件也需要對文件進(jìn)行close關(guān)閉操作 with open('文件路徑', '文件操作方式', encoding='utf-8') as f


32.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。


33.Scrapy每一次發(fā)起請求之前都會在這里檢查網(wǎng)址是否重復(fù)。因此如果確實需要再一次爬取數(shù)據(jù),在Redis中把這個Key刪除即可。


34.插入數(shù)據(jù)時,MongoDB會自動添加一列“_id”,也就是自增ID,每次自動加1


35.Python正則表達(dá)式中“.*”是貪婪模式,獲取最長的滿足條件的字符串。


36.使用Scrapyd,可以實現(xiàn)一鍵部署Scrapy爬蟲,訪問一個網(wǎng)址就啟動/停止爬蟲


37.Python中元組生成以后還可以往里面繼續(xù)添加數(shù)據(jù),也可以從里面刪除數(shù)據(jù);


38.如果目標(biāo)網(wǎng)站本身就是提供公眾查詢服務(wù)的網(wǎng)站,那么使用爬蟲是合法合規(guī)的。


39.HTTP狀態(tài)碼302與307完全同義。


40.如果元組里面只有整數(shù)、浮點數(shù)、字符串、一個列表,就既不能添加數(shù)據(jù),也不能刪除數(shù)據(jù),還不能修改里面數(shù)據(jù)的值。


41.HTTP狀態(tài)碼302表示資源永久重定向。


42.使用異步加載技術(shù)的網(wǎng)站,被加載的內(nèi)容可以在源代碼中找到


43.Python中條件語句在使用and連接的多個表達(dá)式中,只要有一個表達(dá)式不為真,那么后面的表達(dá)式就不會執(zhí)行。


44.當(dāng)運行爬蟲代碼后,出現(xiàn)"Forbidden by robots.txt"提示后,說明當(dāng)前時間段被爬取的網(wǎng)站無法訪問。


45.在請求頭中設(shè)置User-Agent即可正常請求網(wǎng)站


46.爬蟲中間件的激活需要另外寫一個文件來進(jìn)行


47.在Ubuntu下若要運行Redis可以使用CMD進(jìn)入解壓以后的文件夾并運行命令redis-server.exe redis.windows.conf啟動Redis


48.當(dāng)使用Charles監(jiān)控iOS設(shè)備或者Android設(shè)備的數(shù)據(jù)包以后,打開微信小程序,小程序的數(shù)據(jù)包不能自動被Charles抓住,需要另作處理。


49.charles配置中,安裝完成證書以后,在設(shè)置中打開“關(guān)于本機(jī)”,找到最下面的“證書信任設(shè)置”,并在里面啟動對Charles證書的完全信任。


50.Python中寫CSV文件的writerows方法參數(shù)為字典類型



奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學(xué)習(xí)
詳情請咨詢QQ : 3230981406或微信:aopopenfd777


作業(yè)咨詢 論文咨詢
微信客服掃一掃

回到頂部