博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
爬虫 - POJ题目信息
阅读量:2125 次
发布时间:2019-04-30

本文共 1035 字,大约阅读时间需要 3 分钟。

####方便Markdown写博客

import re,requestsfrom bs4 import BeautifulSoup# ptt = soup.find_all(name='div', attrs={"class":"ptt"})[0]#获取小标题def get_title(soup):    return soup.find_all(name='p', attrs={
"class":"pst"})#获取文本def get_text(soup): return soup.find_all(name='div', attrs={
"class":"ptx"})#获取样例def get_sample(soup): return soup.find_all(name='pre', attrs={
"class":"sio"})print("Please input URL:")url = input()html = requests.get(url)soup = BeautifulSoup(html.text, "lxml")text_list = get_text(soup)[0:3]title_list = get_title(soup)[0:5]sample_list = get_sample(soup)text = list()title = list()all = list()#处理文本 加换行符for i in text_list: text.append(i.text + '\r\n')for i in title_list: title.append("#### " + i.text + '\r\n')for i in sample_list: i = '```\r\n' + i.string + '\r\n' + '```\r\n' text.append(i)for i in range(5): all.append(title[i] + text[i])URL = '[题目链接]' + '(' + url + ')' + '\r\n'f = open('POJ.txt', 'w')f.write(URL)for i in all: f.write(i)f.write("#### AC\n- ")f.close()print("Done!")

转载地址:http://fuprf.baihongyu.com/

你可能感兴趣的文章
Intellij IDEA使用(二)—— 在Intellij IDEA中配置JDK(SDK)
查看>>
Intellij IDEA使用(三)——在Intellij IDEA中配置Tomcat服务器
查看>>
Intellij IDEA使用(四)—— 使用Intellij IDEA创建静态的web(HTML)项目
查看>>
Intellij IDEA使用(五)—— Intellij IDEA在使用中的一些其他常用功能或常用配置收集
查看>>
Intellij IDEA使用(六)—— 使用Intellij IDEA创建Java项目并配置jar包
查看>>
Eclipse使用(十)—— 使用Eclipse创建简单的Maven Java项目
查看>>
Eclipse使用(十一)—— 使用Eclipse创建简单的Maven JavaWeb项目
查看>>
Intellij IDEA使用(十三)—— 在Intellij IDEA中配置Maven
查看>>
面试题 —— 关于main方法的十个面试题
查看>>
集成测试(一)—— 使用PHP页面请求Spring项目的Java接口数据
查看>>
使用Maven构建的简单的单模块SSM项目
查看>>
Intellij IDEA使用(十四)—— 在IDEA中创建包(package)的问题
查看>>
Redis学习笔记(四)—— redis的常用命令和五大数据类型的简单使用
查看>>
Win10+VS2015编译libcurl
查看>>
Windows下使用jsoncpp
查看>>
Ubuntu下测试使用Nginx+uWsgi+Django
查看>>
Windows下编译x264
查看>>
visual studio调试内存泄漏工具
查看>>
开源Faac实现PCM编码AAC
查看>>
Windows下wave API 音频采集
查看>>