今天给大家伙儿唠唠这个北大青鸟云题库,我是咋把它给扒下来的。这玩意儿,一开始真给我整懵。
准备工作
咱也不知道从哪下手。就跟无头苍蝇似的,到处乱撞。后来我静下心来想想,这题库,它不就是一道道题嘛那肯定得有个地方存着这些题。
于是我打开浏览器,开始在那网页上瞎点。点来点去,发现它这个题库,它不是那种直接把所有题目都列出来的。你得先选科目,再选章节,然后才能看到题目。这可咋整?
摸索阶段
我想着它这题目肯定是通过啥方式从服务器上弄下来的。于是我打开开发者工具,开始看那个网络请求。这一看,还真让我给发现点东西。
小编温馨提醒:本站只提供游戏介绍,下载游戏推荐89游戏,89游戏提供真人恋爱/绅士游戏/3A单机游戏大全,点我立即前往》》》绅士游戏下载专区
我发现,每当我选一个章节的时候,它都会发送一个请求,然后返回一堆数据。我把这堆数据复制出来一看,这不就是题目嘛
看到这,我心里就有底。这事儿,能干!
开干
我就开始琢磨,咋把这些题目都给弄下来。我寻思着,这事儿手动肯定不行,太累。得写个程序,让它自动去跑。
用啥写?我琢磨半天,还是选Python。这玩意儿,我用着顺手,而且它有很多库,干这事儿方便。
我先写个程序,模拟浏览器发送请求,把那个章节的题目数据给弄下来。然后,再从这堆数据里,把题目、选项、答案啥的都给提取出来。
提取出来之后,我还得把它们给存起来。存哪?我想想,还是存到文本文件里。这样,以后想看的时候,直接打开就行。
遇到的问题
这中间也遇到一些问题。比如说:
- 有的题目,它带图片,这图片咋整?
- 有的题目,它格式不太规范,提取起来费劲。
- 有的请求,它需要登录,这登录咋模拟?
这些问题,我都一一解决。比如说,图片,我把图片的链接给提取出来,然后单独下载。格式不规范的,我就多写几个判断,尽量让它能正确提取。需要登录的,我就先手动登录,然后把cookie啥的给弄下来,放到程序里。
最终成果
经过一番折腾,我终于把这个北大青鸟云题库给扒下来。看着那一堆文本文件,我心里那个美!
不过这事儿,咱可不能到处乱说。毕竟这题库是人家的,咱这么干,有点不太地道。我就自己偷偷用,不给别人看。
好,今天就跟大家伙儿分享到这。希望对你们有所启发。记住,遇到问题,别慌,静下心来,慢慢琢磨,总能找到解决办法的。