最新消息:XAMPP默认安装之后是很不安全的,我们只需要点击左方菜单的 "安全"选项,按照向导操作即可完成安全设置。

Python爬虫抓取网站名人警句

XAMPP案例 admin 24浏览 0评论
人呐,还是要多读一些伟人的思想,伟人之所以称之为伟人,就是他们的思想与众不同,当我们这些傻白甜琢磨着怎么吃,吃什么,啥好吃的话题的时候,大佬可能在想一些莫名其妙的高级的东西,靠近他们或许我们也能够提升一些境界。所以作者想着每天能都看到这么一个名人警句,而且还不能重复,当然这块不是咋自己造,咋也是把伟人说过的话抄过来,然后用python进行一些处理,然后选中一条返回来让咋们看一看,说不定那个早上就茅塞顿开,人生就开了挂呐。哈哈,作者闲着没事呐就自己撸了一个。这里把代码贴出来,供自己和大家复习和学习。
名人警句是从这里抄的:

drh00095

python代码如下:
class JingJu:
    #名人名言的字典
    files=["20210627.txt","20210628.txt"]
    list=[]
    #现在读取到的名言警句的游标
    indexFile="index"
    index=0
    #警句整理,去除序号和开都的标点符号
    def executeFile(self):
        for file in self.files:
            fo = open(file,"r",encoding='gbk')
            list=[]
            for line in fo.readlines():
                line=line.replace("\n","").strip()
                if line!='':
                    if line.__contains__("."):
                        list.append(line.split('.')[1]+"\n")
                    else:
                        list.append(line+"\n")
            for item in list:
                print(item)
            fo.close()
            f = open(file, "w",encoding='gbk')
            f.writelines(list)
            f.close()

    #从文件中获取一个警句
    def readOneJinju(self):
        for file in self.files:
            fr=open(file,"r",encoding="gbk")
            for line in fr.readlines():
                self.list.append(line)
        #默认的警句
        if len(self.list)==0:
            return '不劳而获是这世界上最大的坏!'

        fi=open(self.indexFile,"r+",encoding="utf-8")
        index=fi.readlines()
        if len(index)!=0 and index[0].strip()!='':
            index=int(index[0])
            self.index=index+1
            if self.index>len(self.list):
                self.index=0

        print(self.list[self.index])
        fi.write(str(self.index))
        fi.close()
        return self.list[self.index]

JingJu().readOneJinju()
这里有个index的文件是名人警句的读取位置,这里读到了第十二个。

drh95

运行的效果如下,咋多运行几次:
drh095
drh0095

转载请注明:XAMPP中文组官网 » Python爬虫抓取网站名人警句