wsgi简介，flask和scrapy的简单使用

2022-06-19 12:28:58

WSGI接口定义非常简单，它只要求Web开发者实现一个函数，就可以响应HTTP请求。

def application(environ, start_response):
    start_response('200 OK', [('Content-Type', 'text/html')])
    return [b'<h1>Hello, web!</h1>']

environ：HTTP请求信息

start_response:start_response是外部传入的，调用时候两个参数，一个返回状态码，一个头部信息

返回：一个http的body信息

flask简单使用：

这个form action='',method='',决定提交的时候的post

from flask import Flask
from flask import request

app = Flask(__name__)

@app.route('/', methods=['GET', 'POST'])
def home():
    return '<h1>Home</h1>'

@app.route('/signin', methods=['GET'])
def signin_form():
    return '''<form action="/signin" method="post">
              <p><input name="username"></p>
              <p><input name="password" type="password"></p>
              <p><button type="submit">Sign In</button></p>
              </form>'''

@app.route('/signin', methods=['POST'])
def signin():
    # 需要从request对象读取表单内容：
    if request.form['username']=='admin' and request.form['password']=='password':
        return '<h3>Hello, admin!</h3>'
    return '<h3>Bad username or password.</h3>'

if __name__ == '__main__':
    app.run()

scrapy用法简介：

scrapy startproject scrapyspider

scrapy.cfg: 项目的配置文件。

scrapyspider/items.py: 项目中的item结构，供下面parse解析返回，和piplines使用。

scrapyspider/middlewares: 爬取，解析和保存的中间件。

scrapyspider/pipelines.py: 实现process_item（self，item， spider），保存爬取结果。

scrapyspider/settings.py: 项目的设置文件。

scrapyspider/spiders/: 放置spider代码的目录。

spider代码的目录，实现name， start_urls（or 函数 start_requests），parse（self，response）。

start_requests和parse都用yield 生成器式返回一个个结果。

from scrapy.spiders import Spider
class BlogSpider(Spider):
    name = 'woodenrobot'
    start_urls = ['http://woodenrobot.me']

    def parse(self, response):
        titles = response.xpath('//a[@class="post-title-link"]/text()').extract()
        for title in titles:
            print title.strip()

切换到scrapyspider目录，运行这个name的爬虫。

scrapy crawl woodenrobot

作者：sf131097
原文链接：https://blog.csdn.net/sf131097/article/details/79463912
更新时间：2022-06-19 12:28:58

相关文章

JavaScript 消息框
JavaScript 中可以创建三种类型的“消息框”：警告框（alert）警告框经常用于确保用户可以得到某些
2023-04-08

C++中namespace跨多个文件的问题
在C++14标准中（我使用的是最接近的working draft, N3797），在"7.3 Namespac
2023-04-08

C#关于使用lock关键字，线程锁
lock为线程锁，确保同一个时刻只有一个线程访问资源；摘要：lock为互斥锁，在一个类里面声明一个私有静态ob
2023-04-08

装饰模式C++详解
装饰模式的作用装饰模式C++代码实现代码实现装饰模式的缺点# 装饰模式1. 装饰模式的作用动态的给一个对象添一
2023-04-08

随机文章

C# 用代码添加textBox组件
VS 进行C#编程时，可以通过设计器视图直接拖一个textBox组件进去，但有时候进行二次开发时设计器并不一定
2022-10-20

JAVA 获取mac地址
JAVA 获取mac地址import java.net.InetAddress;import java.net
2022-10-20

python——导入第三方库的方法
第一种：cmd开始——> cmd——>pip install <库名>第二种：pyc
2022-10-20

Pytorch Note24 防止过拟合
Pytorch Note24 防止过拟合文章目录Pytorch Note24 防止过拟合正则化Dropout全
2022-10-20

文章导航

热门标签

VPN BGP 华为 DHCP 组播 ISIS NAT 交换机 H3C 交换 TCP RADIUS LDP 链路聚合网络工程师小助手路由 QOS IPV6 IGMP CCNA视频教程 MPLS Vlan STP Wireshark PIM BGP选路 LACP IP GPON OSPF

最新文章

PHP范围解析运算符（：:)
介绍在PHP中，双冒号::定义为Scope Resolution Operator。
2023-11-18

完全删除数组中的多余元素-JavaScript
我们需要编写一个函数，该函数接受一个数组并返回一个新数组，该数组已删除了所有重复值。
2023-11-18

在不使用库函数的情况下使用真实/伪造的值展平数组-JavaScript
我们需要编写一个JavaScript数组函数，该函数接受具有伪造值的嵌套数组，并返回
2023-11-18

JavaScript在数组的伪索引处插入元素方法详解
我们需要编写一个Array函数，比如pushAtFalsy()，该函数应该包含一个数
2023-11-18

PHP整数数据类型
定义和用法在PHP中，Integer是标量数据类型，代表数字常量，代表整数，不带任何
2023-11-18

PHP错误控制运算符
介绍在PHP中，将@符号定义为错误控制运算符。当它以任何表达式为前缀时，PHP解析器
2023-11-18

PHP类型杂耍详解
定义和用法PHP被称为动态类型语言。在PHP中既不需要也不支持变量的显式类型声明。与
2023-11-18

PowerShell版本7中引入了哪些新的Null运算符？
PowerShell版本7引入了一些新的空运算符。它们如下。空合并运算符-??空条件
2023-11-18

PowerShell中$ ErrorView的用途是什么？
$Errorview变量确定PowerShell中错误消息的显示格式。在PowerS
2023-11-18

PHP执行运算符
介绍PHP中定义了一个执行运算符。一个字符串内部背蜱S（``）被视为一个DOS命令（
2023-11-18

Copyright © 2022 忙忙碌碌网
把实用的技术和经验，分享给最需要的读者，希望每一位来访的朋友都能有所收获！

文章目录