文章分类 » python

关于python和jQuery爬坑的点滴

前言:这里使用的python3

一.关于访问网页的方法

1.用urllib访问。

import urllib
import urllib.request


def test(message=None):
    e = message.encode()
    # 把字符串作为 URI 进行编码
    msg = urllib.parse.quote(e)
    # 这个模块的主要作用就是通过引入合适编码和特殊字符对URL进行安全重构,并且可以反向解析。
    url = 'http://xxxx.xx?t=0&w=' + msg

    html = get_Html(url)

    string = html.decode()
    # 以gb2312编码对字符串str进行解码,获得字符串类型对象


def get_Html(m_url):
    page = urllib.request.urlopen(m_url)
    # urlopen返回的是一个HTTPResponse对象
    html = page.read()
    return html


if __name__ == "__main__":
    test()

这种方法也适用用于python3,不过不太建议使用,用法比较复杂。

Continue Reading »

关于图片搜索及外链的获取

主要思路:输入文字,通过搜索引擎获取图片,再获取图片地址。再将图片地址上传到生成外链的服务器,生成外链。

Continue Reading »