Socket网络编程学习笔记

简介

网络中进程之间如何通信？本地的进程间通信可以有很多种方式，但可以总结为下面4类：

消息传递（管道、FIFO、消息队列）
同步（互斥量、条件变量、读写锁、文件和写记录锁、信号量）
共享内存（匿名的和具名的）
远程过程调用（Solaris门和Sun RPC）

在本地可以通过PID来标识一个进程，但是在网络中这是行不通的，网络中进程通信首先要解决的问题是如何唯一标识一个进程，否则通信无从谈起。
其实TCP/IP协议族已经帮我们解决了这个问题，网络层中的IP地址可以唯一标识网络中的计算机，而传输层的“协议”+“端口”可以唯一标识主机中的应用程序。
这样利用三元组（IP地址、协议、端口）就可以标识网络中的进程了，网络中的进程通信就可以以利用这个标志与其他进程交互。

socket中的地址簇

socket.AF_UNIX：用于本机间的进程通信，如果不用这个也可以用pickle序列化实现，不过效率低
socket.AF_INET：IPV4通信
socket.AF_INET6：IPV6通信

socket的类型

socket.SOCK_STRAEM：用于TCPIP通信
socket.SOCK_DGRAM：用于UDP通信
socket.SOCK_RAW：原始套接字，可以用来构造IP头

基本通讯思路

首先是先有接受端计算机，选择socket地址簇和socket的类型（相当于告诉计算机使用何种方式发送和解析数据），需要监听某个端口，
等待远程计算机发送数据，接受此数据，然后发送新的数据给远程计算机，继续保持监听状态。然后有发送端计算机，
选择socket地址簇和socket的类型（相当于告诉计算机使用何种方式发送和解析数据），接受数据，关闭远程连接。

TCP编程

客户端

大多数连接都是可靠的TCP连接。创建TCP连接时，主动发起连接的叫客户端，被动响应连接的叫服务器。举个例子，当我们在浏览器中访问新浪时，
我们自己的计算机就是客户端，浏览器会主动向新浪的服务器发起连接。如果一切顺利，新浪的服务器接受了我们的连接，一个TCP连接就建立起来的，
后面的通信就是发送网页内容了。所以，我们要创建一个基于TCP连接的Socket，可以这样做：

# 导入socket库:
import socket

# 创建一个socket:
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立连接:
s.connect(('www.sina.com.cn', 80))

创建Socket时，AF_INET指定使用IPv4协议，如果要用更先进的IPv6，就指定为AF_INET6。SOCK_STREAM指定使用面向流的TCP协议，
这样，一个Socket对象就创建成功，但是还没有建立连接。

客户端要主动发起TCP连接，必须知道服务器的IP地址和端口号。新浪网站的IP地址可以用域名www.sina.com.cn自动转换到IP地址，
但是怎么知道新浪服务器的端口号呢？

答案是作为服务器，提供什么样的服务，端口号就必须固定下来。由于我们想要访问网页，因此新浪提供网页服务的服务器必须把端口号固定在80端口，
因为80端口是Web服务的标准端口。其他服务都有对应的标准端口号，例如SMTP服务是25端口，FTP服务是21端口，等等。
端口号小于1024的是Internet标准服务的端口，端口号大于1024的，可以任意使用。因此，我们连接新浪服务器的代码如下：

1	s.connect(('www.sina.com.cn', 80))

注意参数是一个tuple，包含地址和端口号。建立TCP连接后，我们就可以向新浪服务器发送请求，要求返回首页的内容：

1 2	# 发送数据: s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')

TCP连接创建的是双向通道，双方都可以同时给对方发数据。但是谁先发谁后发，怎么协调，要根据具体的协议来决定。
例如，HTTP协议规定客户端必须先发请求给服务器，服务器收到后才发数据给客户端。
发送的文本格式必须符合HTTP标准，如果格式没问题，接下来就可以接收新浪服务器返回的数据了：

# 接收数据:
buffer = []
while True:
    # 每次最多接收1k字节:
    d = s.recv(1024)
    if d:
        buffer.append(d)
    else:
        break
data = b''.join(buffer)

接收数据时，调用recv(max)方法，一次最多接收指定的字节数，因此，在一个while循环中反复接收，直到recv()返回空数据，表示接收完毕，退出循环。
当我们接收完数据后，调用close()方法关闭Socket，这样，一次完整的网络通信就结束了：

1 2	# 关闭连接: s.close()

接收到的数据包括HTTP头和网页本身，我们只需要把HTTP头和网页分离一下，把HTTP头打印出来，网页内容保存到文件：

header, html = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
# 把接收的数据写入文件:
with open('sina.html', 'wb') as f:
    f.write(html)

现在，只需要在浏览器中打开这个sina.html文件，就可以看到新浪的首页了。

服务端

服务器进程首先要绑定一个端口并监听来自其他客户端的连接。如果某个客户端连接过来了，服务器就与该客户端建立Socket连接，
随后的通信就靠这个Socket连接了。所以，服务器会打开固定端口（比如80）监听，每来一个客户端连接，就创建该Socket连接。
由于服务器会有大量来自客户端的连接，所以，服务器要能够区分一个Socket连接是和哪个客户端绑定的。
一个Socket依赖4项：服务器地址、服务器端口、客户端地址、客户端端口来唯一确定一个Socket。但是服务器还需要同时响应多个客户端的请求，
所以，每个连接都需要一个新的进程或者新的线程来处理，否则，服务器一次就只能服务一个客户端了。
我们来编写一个简单的服务器程序，它接收客户端连接，把客户端发过来的字符串加上Hello再发回去。首先，创建一个基于IPv4和TCP协议的Socket：

1	s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

然后，我们要绑定监听的地址和端口。服务器可能有多块网卡，可以绑定到某一块网卡的IP地址上，也可以用0.0.0.0绑定到所有的网络地址，
还可以用127.0.0.1绑定到本机地址。127.0.0.1是一个特殊的IP地址，表示本机地址，如果绑定到这个地址，客户端必须同时在本机运行才能连接，
也就是说，外部的计算机无法连接进来。
端口号需要预先指定。因为我们写的这个服务不是标准服务，所以用9999这个端口号。请注意，小于1024的端口号必须要有管理员权限才能绑定：

1 2	# 监听端口: s.bind(('127.0.0.1', 9999))

紧接着，调用listen()方法开始监听端口，传入的参数指定等待连接的最大数量：

1 2	s.listen(5) print('Waiting for connection...')

接下来，服务器程序通过一个永久循环来接受来自客户端的连接，accept()会等待并返回一个客户端的连接:

while True:
    # 接受一个新连接:
    sock, addr = s.accept()
    # 创建新线程来处理TCP连接:
    t = threading.Thread(target=tcplink, args=(sock, addr))
    t.start()

每个连接都必须创建新线程（或进程）来处理，否则，单线程在处理连接的过程中，无法接受其他客户端的连接：

def tcplink(sock, addr):
    print('Accept new connection from %s:%s...' % addr)
    sock.send(b'Welcome!')
    while True:
        data = sock.recv(1024)
        time.sleep(1)
        if not data or data.decode('utf-8') == 'exit':
            break
        sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
    sock.close()
    print('Connection from %s:%s closed.' % addr)

连接建立后，服务器首先发一条欢迎消息，然后等待客户端数据，并加上Hello再发送给客户端。如果客户端发送了exit字符串，就直接关闭连接。
要测试这个服务器程序，我们还需要编写一个客户端程序：

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 建立连接:
s.connect(('127.0.0.1', 9999))
# 接收欢迎消息:
print(s.recv(1024).decode('utf-8'))
for data in [b'Michael', b'Tracy', b'Sarah']:
    # 发送数据:
    s.send(data)
    print(s.recv(1024).decode('utf-8'))
s.send(b'exit')
s.close()

我们需要打开两个命令行窗口，一个运行服务器程序，另一个运行客户端程序，就可以看到效果了。需要注意的是，客户端程序运行完毕就退出了，
而服务器程序会永远运行下去，必须按Ctrl+C退出程序。

用TCP协议进行Socket编程在Python中十分简单，对于客户端，要主动连接服务器的IP和指定端口，对于服务器，要首先监听指定端口，
然后，对每一个新的连接，创建一个线程或进程来处理。通常，服务器程序会无限运行下去。同一个端口，被一个Socket绑定了以后，
就不能被别的Socket绑定了。

UDP编程

客户端（UDP编程）

TCP是建立可靠连接，并且通信双方都可以以流的形式发送数据。相对TCP，UDP则是面向无连接的协议。使用UDP协议时，不需要建立连接，
只需要知道对方的IP地址和端口号，就可以直接发数据包。但是，能不能到达就不知道了。虽然用UDP传输数据不可靠，但它的优点是和TCP比，
速度快，对于不要求可靠到达的数据，就可以使用UDP协议。我们来看看如何通过UDP协议传输数据。和TCP类似，使用UDP的通信双方也分为客户端和服务器。
服务器首先需要绑定端口：

1
2
3

s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 绑定端口:
s.bind(('127.0.0.1', 9999))

recvfrom()方法返回数据和客户端的地址与端口，这样，服务器收到数据后，直接调用sendto()就可以把数据用UDP发给客户端。
注意这里省掉了多线程，因为这个例子很简单。客户端使用UDP时，首先仍然创建基于UDP的Socket，然后，不需要调用connect()，
直接通过sendto()给服务器发数据：

s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
for data in [b'Michael', b'Tracy', b'Sarah']:
    # 发送数据:
    s.sendto(data, ('127.0.0.1', 9999))
    # 接收数据:
    print(s.recv(1024).decode('utf-8'))
s.close()

服务端（UDP编程）

创建Socket时，SOCK_DGRAM指定了这个Socket的类型是UDP。绑定端口和TCP一样，但是不需要调用listen()方法，而是直接接收来自任何客户端的数据：

print('Bind UDP on 9999...')
while True:
    # 接收数据:
    data, addr = s.recvfrom(1024)
    print('Received from %s:%s.' % addr)
    s.sendto(b'Hello, %s!' % data, addr)

从服务器接收数据仍然调用recv()方法。仍然用两个命令行分别启动服务器和客户端测试。
UDP的使用与TCP类似，但是不需要建立连接。此外，服务器绑定UDP端口和TCP端口互不冲突，也就是说，UDP的9999端口与TCP的9999端口可以各自绑定。

常见问题

粘包

粘包问题是指当发送的数据包过大时，接收方可能会将数据包粘在一起，导致数据包的边界不清晰。为了解决粘包问题，可以采用以下方法：

使用包边界标识符在发送数据时，每个数据包都带有边界标识符，接收方根据边界标识符来判断数据包的边界，从而将数据包分开。例如，可以在每个数据包的头部或尾部添加一个包长度字段，接收方根据包长度字段来解析数据包。
使用包分隔符在发送数据时，每个数据包之间都添加一个包分隔符，接收方根据包分隔符来判断数据包的边界。例如，在发送文本数据时，可以在每个数据包之间添加一个换行符，接收方根据换行符来解析数据包。
限制发送数据的大小限制每个数据包的最大大小，确保数据包不会过大，从而避免粘包问题的发生。
增加包的冗余信息在发送数据时，每个数据包都带有冗余信息，例如时间戳或序列号等，接收方根据冗余信息来判断数据包的边界。例如，在发送网络数据时，可以在每个数据包的头部添加一个时间戳字段，接收方根据时间戳字段来解析数据包。

半包

半包问题是指在socket编程中，接收到的数据不是一个完整的数据包，而是一半的数据包或者是一小部分的数据包。这种问题通常出现在网络传输过程中出现丢包或者传输延迟的情况下。下面是解决半包问题的一些方法：

增加重发机制：当接收到的数据不是一个完整的数据包时，可以发送一个请求给发送方，要求发送方重新发送缺失的数据包。发送方接收到请求后，会重新发送缺失的数据包，这样可以确保接收方能够接收到完整的数据包。
使用校验和校验数据的完整性：在发送数据时，可以在数据的末尾添加一个校验值，用于校验数据的完整性。当接收方接收到数据后，可以计算接收到的数据的校验值，并与发送方发送的校验值进行比较，如果一致，则说明接收到的数据是完整的；如果不一致，则说明接收到的数据是半包数据。
增加包的冗余信息：在发送数据时，可以在数据的前面或者后面添加一些冗余信息，用于确保接收方能够正确地接收到数据。例如，在数据的前面添加包的长度信息，这样接收方可以根据包的长度来判断接收到的数据是否完整。
使用滑动窗口协议：滑动窗口协议是一种流控制协议，用于确保接收方能够正确地接收到数据，并且防止接收方的缓冲区溢出。在滑动窗口协议中，接收方维护一个窗口，用于存储已经接收到的数据，发送方根据接收方返回的确认消息来判断哪些数据已经被接收方接收到，从而决定是否继续发送数据。