引言
UDP 稍微扩展了IP协议,使得包可以在进程间传送,而不仅仅是在主机件。——《CSAPP》
IP 数据报是指 IP 层端到端的传输单元。分组(packet)是 IP 层和链路层的传输单元。一个分组可以是一个完整的数据报,也可以是一个分片。——《TCP/IP协议详解卷一 第一版》
UDP 是一种保留消息边界的简单的面相数据报的传输层协议。它不提供差错纠正、队列管理、重复消除、流量控制、拥塞控制。它提供端到端差错检测,也就是传输层端到端校验和,也不保证报文一定能到达目的地。一般来说,每个被应用程序请求的 UDP 输出操作只产生一个 UDP 数据报,从而发送一个 IP 数据报,这一点不同于 TCP 面相数据流的特征。
UDP 本身是提供最小功能的传输层协议:它把应用程序传给 IP 层的数据发送出去。【RFC0768】是 UDP 30 多年来未改变的标准。虽然可靠性和保护性有所缺失,但 UDP 不是一无是处的。因为它的简单,因为它的无连接性,UDP 比其他的传输层协议的开销要小得多。另外,组播和广播操作更多使用 UDP 这样无连接的传输。
UDP header
字段 | 长度(bytes) | 含义 |
---|---|---|
源端口号 | 2 | 见下文“端口号” |
目的端口号 | 2 | 见下文“端口号” |
长度 | 2 | UDP头部和数据的总长度,以字节为单位 |
检验和 | 2 | 见下文“UDP检验和” |
端口号
- 端口号相当于电话号码之后的扩展码,帮助协议辨认进程。
- 它们是抽象的,即不与任何主机、任何物理实体相关。
- 在 UDP 中,端口号是 16 位的特殊数字(0~65535)。
- 源端口号是可选择的,如果发送者不要求回复的话,可以设置源端口号为 0.
- IP 层根据协议字段或 IPv6头部中的下一个头部字段分离到特定的传输协议,这意味着端口号在不同的传输层协议之间是独立的。TCP 端口号只能被 TCP 使用,UDP 亦然。(尽管如此,但如果某个众所周知的服务同时由 TCP 和 UDP 提供,那么这两个端口号通常被分配成一样的)
UDP 检验和
- UDP 校验和是我们遇到的第一个传输层端到端检验和(ICMP 是网络层第一个端到端校验和)。UDP 校验和覆盖 UDP 头部、UDP 数据和 UDP 伪头部。端到端是指由发送方计算得到,由最终的接收方检验,途中不会被修改(除非是通过 NAT)。
- 对比只覆盖头部的 IPv4 检验和,经过每一跳路由器都要修改。传输层协议检验和覆盖传输层协议头部和数据。
- “UDP 伪头部”是指UDP数据报长度可以是奇数长字节,而检验和算法只相加 16 位字(偶数字节),因此对于奇数字节长度的数据报,UDP 会在末尾添加一个都为 0 的填充。仅为了计算校验和,不会被传递出去。
UDP 和 IP 分片
在链路层中有介绍,链路层对可传输帧长度有一个最大上限。IP 引入分片和重组。IP 转发时,做出的判断,不仅根据路由表,也根据要求的 MTU 是多少。如果数据报太大则进行分片。
- 分片可以在发送方到目的地上的端到端路径上任何中间路由器进行。
- 重组直到它到达最终目的地才会被重组。原因有二:一、网络中不进行重组减轻路由器的负担。二、不同分片可能经过不同路径到达目的地,这样的话路由器没有能力来重组。
总结
UDP 是一个简单的协议。它给 IP层之上的用户进程提供了端口号和检验和机制。没有流量控制、拥塞控制、差错纠正。有差错检测和消息边界保留。
我们看到了 UDP 用于IP 分片、路径 MTU 发现。当出现如下情况,最常用的就是 UDP 了:
- 要避免建立连接的开销。
- 多端点传送(组播、广播)
- 不需要 TCP 相对笨重的可靠
UDP 的主要用途之一是 DNS(域名系统)。UDP 占据了观察到的互联网流量的 10% - 40%,随着点对点应用数量的增加,UDP 的使用仍在上升,虽然 TCP 在稳定性方面占据了统治地位。网络分片流量大多数 UDP 的,尽管总体流量中只有极少数是分片。分片中的流量类型主要有基于 UDP 的多媒体流量、VPN 隧道中封装的隧道流量。