第1章 Python和Web开发框架

Django是一个开放源代码的Web开发框架,完全用Python开发。它对常用的Web开发模式进行了高度封装,为常见的编程任务提供了捷径;通过减少重复的代码,使程序员能够专注于Web 应用上的关键性的业务开发。因此使用 Django 能在较短的时间内构建并维护质量上乘的Web应用。Django必须运行在Python环境中,可见二者密不可分。

1.1 Python简介

Python由吉多·范罗苏姆(Guido van Rossum)创造,Python被设计成一种跨平台的计算机程序设计语言,是一种面向对象的动态类型语言。自20世纪90年代初Python诞生至今,它已广泛应用于系统管理的任务处理和Web编程。

Python的设计理念是“优雅”“明确”“简单”,它是一种功能强大的编程语言,主要有以下特点。

●Python具有解释型、交互式、面向对象这3个特征。

●Python有极其简单、明确的语法,关键字较少,结构简单。

●Python可跨平台,在Linux、Windows和macOS等操作系统中都能很好地运行。

●Python提供所有主流的商业数据库的接口。

●Python提供了一个很好的结构,支持大型程序开发。

●Python是自由/开放源码的软件之一。

1.2 Web开发框架基本知识

Web开发框架是用于Web开发的成套软件架构。Web开发框架会为Web应用提供成套的功能支持,即一套开发和部署网站的方案。使用Web开发框架,程序员可以只关注业务逻辑代码的编写,其他功能使用框架已有的功能即可,这减少了程序员的代码编写量。

Web服务本质上是由socket(socket是一种通信机制,通过绑定IP地址和端口产生一个通信链,实现计算机间的通信)服务端向socket客户端提供HTTP响应,而浏览器就是一个socket客户端,它向Web发出请求。Django本身是一个Web开发框架,它连接socket两端(服务端、客户端)进行数据交换,当然这种交换按照指定的协议进行,也就是HTTP(Hyper Text Transfer Protocol,超文本传输协议)。

1.2.1 Web应用本质

网络中不同的计算机间进行通信必须经过IP地址和端口。为了降低网络通信开发的复杂度,人们在TCP/IP 4层结构中的应用层与传输层之间加了一层,这个层就是socket层。它把复杂的TCP/IP进行了封装,并提供了一组服务的接口。

网络中服务器主机会提供一种或多种服务,每一种服务打开一个socket,并绑定到一个端口上,也就是说不同的端口对应于不同的服务(如Web服务一般用到80端口),客户端向那个端口发送请求,就会得到相应的服务。

当用户在浏览器地址栏中输入网址(URL,即Uniform Resource Locator,统一资源定位符)并按下Enter键,这个动作称为发送Web请求,在网络上会有一台与网址相对应的服务器按用户请求做出响应,把请求资源发送给用户。这台接收Web请求并做出响应的服务器称为Web服务器,它把用户请求的资源以HTML(Hyper Text Markup Language,超文本标记语言)文件的形式传递到用户的浏览器中,用户就看到网页了。

如上所述,Web应用主要做的事情就是发送HTML文件到浏览器,其核心功能则通过socket服务完成。因此,Web服务器本质上是一个socket服务端,而浏览器本质上是一个socket客户端。

以下用代码来简单说明Web开发框架的运行方式。

        # 导入socket模块
        import socket
        # 建立socket服务
        sk=socket.socket()
        # 绑定IP与端口号,这是绑定本机端口
        sk.bind(('127.0.0.1',8000))
        # 进行监听
        sk.listen()
        print('socket服务开始运行……')
        while True:
          # 接收socket客户端连接
          conn,addr=sk.accept()
          # 接收socket客户端数据
          data=conn.recv(1024)
          # print(data)
          # 向客户端发送消息,字符串前加字母b表示以字节形式传递
          conn.send(b"HTTP/1.1 200 OK\r\n\r\n")
          # 向客户端发送消息,bytes()函数把字符串转换成字节形式
         conn.send(bytes("我是socket服务端,我已接到你的请求。",encoding='utf-8'))
  

以上代码主要实现如下过程。

(1)建立socket服务,绑定IP与端口号,并启动监听进程,这样就把本地计算机设置成socket服务端。

(2)服务启动后,通过循环语句,持续接收浏览器(socket客户端)发送的信息。

(3)socket服务端与浏览器以字节形式在网络上传递消息,在发送字符串前必须将其转化成字节形式。

(4)socket 服务端与浏览器的消息传递必须依照HTTP 格式,conn.send(b"HTTP/1.1 200 OK\r\n\r\n")这句代码把字符串按照HTTP格式向浏览器传递,主要格式为HTTP/1.1 200 OK,字符串后面跟两对回车符和换行符“\r\n\r\n”,这样其后的字符串就能显示在浏览器中。

在命令行终端输入python test1.py运行代码启动socket服务,如图1.1所示。

图1.1 启动socket服务

这时在浏览器中输入http://127.0.0.1:8000/,socket服务端收到请求后,返回相关信息。由于是按照HTTP格式返回信息,所以信息能显示在浏览器上,如图1.2所示。

图1.2 浏览器显示socket服务端发回的信息

1.2.2 Web开发框架核心功能

1.2.1 节中的代码没有实现根据浏览器地址栏中的URL不同而做出不同响应,本节我们对代码进行改进与完善,实现Web开发框架核心功能,完善后的代码如下。

            import socket
            def index(url):
              # 读取文件,并对占位符进行替换
              # with用法:在退出with代码块后自动关闭with打开的文件
              with open('index.html', 'r',encoding='utf-8') as f:
                rd = f.read()
                rd = rd.replace("$@index$@", "首页")
              # 替换后的文本以字节形式返回
              return bytes(rd,encoding='utf-8')
            def test(url):
              with open('test.html', 'r',encoding='utf-8') as f:
                rd = f.read()
                rd = rd.replace("$@test$@", "测试")
              return bytes(rd,encoding='utf-8')
            def fun404(url):
              ret = "<h1>not found!</h1>"
              return bytes(ret, encoding='utf-8')
            # 定义变量url_func,建立了URL与函数名的对应关系
            url_func=[
              ("/index/",index),
              ("/test/",test),
            ]
            # 建立socket服务
            sk=socket.socket()
            # 绑定IP与端口号,这里是绑定本机端口
            sk.bind(('127.0.0.1',8000))
            # 进行监听
            sk.listen()
            print('socket服务开始运行……')
            while True:
              # 接收socket客户端连接
              conn, addr = sk.accept()
              """
              下面语句中data变量接收socket客户端(浏览器)数据,这个数据有固定格式
              数据是HTTP请求数据格式,第一行格式为GET /index/ HTTP/1.1\r\n
  

该行以\r\n结尾,各字符串以空格分隔

              """
              data = conn.recv(1024)
              # 输出socket服务端接收的浏览器发来的消息格式
              print(data)
              if not data:
              # 如果客户端没有发送新的数据,就重新开始,不再向下执行
              # 防止后面语句对空字符进行操作而抛出异常
                continue
              # 把收到的数据由字节形式转换成字符串,一般用到的编码格式为utf-8
              data_str = str(data, encoding='utf-8')
              # 以\r\n分隔每一行
              line = data_str.split("\r\n")
              # print(line[0])
              # 取出第一行字符串(line[0]),然后用空格再次分隔字符串
              # 提示:在Django中的索引从0开始
              v1 = line[0].split()
              # 取出路径,路径字符串在第2个位置上(以空格分隔)
              url = v1[1]
              """
              向客户端发消息,字符串前加字母b表示以字节形式传递
              在HTTP/1.1 200 OK\r\n\r\n之后的内容以HTTP格式显示在浏览器中
              """
              conn.send(b"HTTP/1.1 200 OK\r\n\r\n")
              func=None
              """
              用for循环取出url_func中的每一项,它是由URL和函数名组成的元组向客户端发消息
              """
              for i in url_func:
                if i[0] == url:
                  # 取出对应函数名
                  func = i[1]
                  break
              if func:
                func = func
              else:
                func = fun404
              # 函数名加上括号,表示执行函数
              rep = func(url)
              # 把函数返回的值向客户端发送
              conn.send(rep)
              conn.close()
  

上述代码的相关说明如下。

(1)以上代码定义了两个函数——index()和test(),还定义了一个列表类型的变量,列表中每项都是元组,其列出URL与函数名的对应关系。程序流程主要是:根据传入的参数(URL),读取相应的HTML文件,并根据占位符(本例中用两个$@包含一个变量名表示一个占位符,形如$@index$@)进行替换实现网页动态显示。

(2)index()函数和test()函数读取相应的HTML文件并进行占位符替换,同时以字节形式返回替换后的文本,进行替换的HTML文件index.html所含代码如下,请注意占位符$@index$@的位置。

            <!DOCTYPE html>
            <html lang="en">
            <head>
            <meta charset="UTF-8">
            <title>index页面</title>
            </head>
            <body>
              <h1>$@index$@</h1>
            </body>
            </html>
  

test.html的代码与index.html的代码相似,此处不再列举。

(3)代码还增加了一个fun404()函数来处理无对应关系的路径。

(4)在while True代码块中增加了对浏览器(socket客户端)传来的消息的处理,解析出浏览器地址栏中URL的路径,要正确解析路径必须了解浏览器传给socket服务端的消息格式。这里以在浏览器地址栏中输入http://127.0.0.1:8000/index/为例,通过print语句可以看到socket服务端收到的消息格式如下。

            GET /index/ HTTP/1.1\r\n
            Host: 127.0.0.1:8000\r\n
            Connection: keep-alive\r\n
            User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)
            Chrome/63.0.3239.132 Safari/537.36\r\n
            Accept-Encoding: gzip, deflate, br\r\n
            Accept-Language: zh-CN,zh;q=0.9\r\n\r\n
  

可以看到消息格式以\r\n分隔每行,每行中各项再以空格进行分隔,通过这个格式即可理解代码是如何解析路径的。

运行python test2.py以进行测试,实现了针对不同请求进行响应的过程,如图1.3所示。

图1.3 socket服务端对浏览器的不同请求做出不同响应

1.2.3 HTTP简单介绍

为了使读者能有效地理解代码,这里有必要简单介绍一下HTTP。HTTP就是浏览器(客户端)与Web服务器交流的语言,它是一种双方都认可的格式或规则,也就是这种语言是双方都能“听得懂”的语言,因此协议就是一种格式,这种格式让双方都知道对方想表达什么意思、想做什么事。

HTTP消息格式有请求和响应两种,HTTP请求和响应都包含Header和Body两部分,其中Body是可选的。

1.2.4 HTTP请求消息格式

HTTP请求(Request)消息包含请求头(Header)和请求体(Body)。请求头每行以“\r\n”结尾,请求头第一行以空格分隔的字符串分别代表请求方法、路径、HTTP等信息。第二个字符串就是路径,是一个较为重要的字符串,由此可推知浏览器地址栏中的URL。请求头从第二行开始都是“头字段名:值\r\n”的形式。请求头与请求体之间以“\r\n”分隔,请求体可以有也可以没有。以下是HTTP请求消息格式的示意代码。

            请求方法 路径 HTTP/1.1\r\n # 请求方法包括GET、POST等
            头字段名:值\r\n
            头字段名:值\r\n
            …
            头字段名:值\r\n
            \r\n
            请求体 # 请求体可以有,可以没有
  

以下是实例代码,其中,GET 表示请求方式,请求的路径是/index/,应用的协议是HTTP,协议的版本是1.1。

            GET /index/ HTTP/1.1\r\n
            Host: 127.0.0.1:8000\r\n
            Connection: keep-alive\r\n
            User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)
            Chrome/63.0.3239.132 Safari/537.36\r\n
            Accept-Encoding: gzip, deflate, br\r\n
            Accept-Language: zh-CN,zh;q=0.9\r\n
            \r\n
            … # 请求体可以有,可以没有
  

1.2.5 HTTP响应消息格式

HTTP响应(Response)消息包含响应头(Header)和响应正文(Body)。响应头每行以“\r\n”结尾,响应头第一行包含代表HTTP、状态码和状态描述符等信息的3个字符串,这3个字符串以空格作为分隔符。响应头从第二行开始都是“头字段名:值\r\n”的形式。响应头与响应正文之间以“\r\n”分隔,响应正文就是显示在浏览器中的HTML格式的内容。以下是HTTP响应消息格式的示意代码。

            HTTP/1.1 状态码 状态描述符\r\n
            头字段名:值\r\n
            头字段名:值\r\n
            …
            头字段名:值\r\n
            \r\n
            响应正文 # 响应正文,就是HTML格式的内容
  

以下是实例代码,其中,HTTP/1.1表示HTTP的版本是1.1,状态码200表示响应正常,OK是响应成功的描述字符串,另外还有服务器信息Server、响应时间Date等内容。

            HTTP/1.1 200 OK\r\n
            Server: openresty/1.9.15.1\r\n
            Date: Fri, 05 Jul 2019 07:58:16 GMT\r\n
            Content-Type: text/html; charset=utf-8\r\n
            Transfer-Encoding: chunked\r\n
            \r\n
            … # 响应正文
  

1.3 Python Web开发框架

1.2节我们用Python代码的形式解释了如何用socket来实现Web开发框架的流程,Web开发框架的本质就是用HTTP实现socket服务端与浏览器的通信功能。这些功能可以概括为3步。

(1)socket服务端与客户端(浏览器)收/发socket消息,按照HTTP来解析消息。

(2)建立URL与要执行的函数的对应关系,这里的函数包含业务逻辑代码。

(3)载入HTML文件当作模板,对其中特殊符号标识的字符串进行替换并发给浏览器显示。

不理解或看不懂本章关于Web开发框架的代码对于Django开发影响不太大,读者不用担心。对该代码的理解有利于从Web开发本质与原理层面理解Django,会提高Django开发效率。

Python中的Web框架一般实现3种核心功能。

●收发消息(socket功能)。

●根据用户不同路径执行不同的函数。

●从HTML文件中取出内容,并且完成字符串的替换。

目前主流的Python Web开发框架主要有Django、Tornado和Flask这3种。

① Django是目前最流行的Web开发框架之一,该框架包含以上3种核心功能中的第二、第三种功能,这两种功能可以很容易地通过编写代码或配置来实现,第一种功能使用第三方工具实现。Django是Python中最全能的Web开发框架之一,功能完备,在可维护性和开发速度上具有优势。

② Tornado包含以上3种核心功能,但需要开发人员通过代码实现。该框架最大的特点是采用异步处理,是非阻塞式、高并发处理框架,性能强大,可以每秒处理数以千计的连接。Tornado是实现实时Web服务的理想框架。其缺点是相比于Django,诸多内容需要开发人员自己去编写。随着项目越来越大,Tornado将有越来越多的功能需要开发人员来实现。

③ Flask可实现以上3种核心功能中的第二种功能,第一、第三种功能使用第三方工具实现,是轻量级的开发框架。Flask的特点是使用简单的核心,并使用插件扩展其他功能,因此Flask是一个面向简单需求和小型应用的微框架。

1.4 小结

本章简单介绍了Python的特点,并介绍了Web开发框架基本知识、HTTP以及常见的Python Web开发框架,使读者对Django的原理有所了解。