互联网

关于互联网上七大姑,八大姨的一些九卦。

nltk book

0

nltk book 一、首先确保你安装了book里面的内容。 二、看看nltk.book有些什么东西 输入text1就可以显示书名 >>> text1 <Text: Moby Dick by Herman Melville 1851> >>> text2 <Text: Sense and Sensibility by Jane Austen 1811> >>> 三、搜索 执行的结果是这样的: >>>……

NLP的构想

0

NLP的构想 要想实现机器生成文章。 需要以下几点: 必须以句子为单位进行文章的构建,那么首先需要的功能: 1、将文章分割成为以句子为单位的形式。 2、必须对句子进行主题归类,即当前的句子说的是什么主题. 3、必须对句子在文章中出现的位置进行归类。 中文的范式一般是: 以什么的精神(要求)下,如何做(how),我们要达……

python nltk中文试用手记

0

python nltk中文试用手记 安装: pip install nltk 安装后打算用了,没相到出现如下的错误: Resource 'corpora/gutenberg' not found. Please use the NLTK Downloader to obtain the resource: >>> nltk.download() 然后再执行以下代码: import nltk nltk.download() 会弹出一个界面,让你选择所需要安装的包,如果选择安装所有……

Word2vec应用第一次手记

0

Word2vec应用第一次手记 测试环境: win7 ultimate(en) Anaconda 3 一、安装Word2vec Word2vec需要使用第三方gensim模块, gensim模块依赖numpy和scipy两个包,因此需要依次下载对应版本的numpy、scipy、gensim。 不过如果你使用Anaconda的话,前两个包已经安装好了,可能直接使用pip命令安装第三个包即可。 二、下载训练数据 下载地址如下:http……

分词系统的标注集

0

分词系统的标注集 一、HanLP开源分词系统 二、ansj分词 作者说arrays.dic是使用结巴分词的。 经过核实,ansj分词可能用的是新版的北大标注集。 《现代汉语语料库加工规范——词语切分与词性标注》词性标记 代码名称 帮助记忆的诠释 例子 及 注解 1 Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。 绿色/n  似/d  锦/Ag ……

密码保护:中文伪原创工具

0

密码保护:中文伪原创工具 自己做的一个中文伪原创工具。 原稿: 中央政法委近日印发《关于学习宣传方金刚同志先进事迹的通知》,号召全国政法机关和全体政法干警,结合学习贯彻党的十九大精神和习近平新时代中国特色社会主义思想,结合推进“两学一做”学习教育常态化制度化,深入开展学习宣传方金刚同志先进事迹活动,在推进“四个全面”的征程中,不……

分割文件的源码

0

分割文件的源码 可以将一个大的txt文件分割成N个txt文件,可以自己设定每个文件的行数,非常实用。 源码如下: #coding:utf-8 #将大文本文件分割成多个小文本文件 import os sourceFileName = "test.txt" #定义要分割的文件 def cutFile(): print u"正在读取文件..." sourceFileData = open(sourc……

采集微信公众号(二)

0

采集微信公众号(二) 此方法是通过微信公众号文章接口来采集。 一、获取接口数据 进入微信公众号平台,然后执行:素材管理--新建图文素材功能,点击超链接图标。 通过查找文章的功能来搜索公众号 通过查看源码功能,可以看到这个公众号的fakeid。 还可以获取文章的接口地址: 最后附赠源码: # -*- coding: utf-8 -*- from selenium ……

selenium(python)教程

0

selenium(python)教程 Updated on Aug-11-2019 今天再试了一下,发现自己的chrome安装路径变成“C:\Users\Kevin\AppData\Local\Google\Chrome\Application”这个了。 然后将安装路径改成这个,又报如下错误: SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in positio n 2-3: truncated \UXXXXXXXX escape 将代码改……

Page: 61 of 85 1 ... 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 ... 85