2024年2月

今天同事发开中遇到了一个代码性能优化的问题,原本需求是:从一个数据库中查询某个表数据,存放到datatable中,然后遍历datatable,看这些数据在另一个数据库的表中是否存在,存在的话就要更新,不存在就要插入。

就这个需求本身来说很简单,但是随着数据量的增大,之前通过循环遍历的方式就出现了性能问题。我在思索片刻后,给出的建议是分页查询和利用事务批量提交。

1.利用数据库事务批量提交

1 using (SqlTransaction transaction =targetConnection.BeginTransaction())2 {3                 foreach (DataRow row indataTable.Rows)4 {5                     if(CheckIfDataExists(targetConnection, transaction, row))6 {7 UpdateData(targetConnection, transaction, row);8 }9                     else
10 {11 InsertData(targetConnection, transaction, row);12 }13 }14 
15 transaction.Commit();16 }17 }18 
19 //下面两个方法都还可以优化,需要接收批量sql语句,所以可以修改成list<SqlCommand>,然后遍历执行,此处能说明问题即可
20   private voidUpdateData(SqlConnection connection, SqlTransaction transaction, DataRow row)21 {22         using (SqlCommand command = new SqlCommand("UPDATE YourTable SET YourUpdateStatement WHERE YourCondition", connection, transaction))23 {24             //Add parameters to your command here, based on your update statement and condition25             //command.Parameters.AddWithValue("@ParameterName", row["ColumnName"]);
26 
27 command.ExecuteNonQuery();28 }29 }30 
31     private voidInsertData(SqlConnection connection, SqlTransaction transaction, DataRow row)32 {33         using (SqlCommand command = new SqlCommand("INSERT INTO YourTable (YourColumns) VALUES (YourValues)", connection, transaction))34 {35             //Add parameters to your command here, based on your columns and values36             //command.Parameters.AddWithValue("@ParameterName", row["ColumnName"]);
37 
38 command.ExecuteNonQuery();39 }40     }

看到这里的时候,大家可以考虑下,以上方案还有什么优化的地方吗?

当然是有的,如果数据量持续增大,datatable这样直接加载到内存的方式恐怕会成为性能问题点吧,我们得考虑怎么优化才能避免将大数据一次性加载到内存,大部分同学第一个想到的就是分页,这个方案当然是没有错,但是还不够高级,给大家提示一个关键字“yield”,或许从聪明的你已经悟到了,接着往下看。

2.流式处理法

什么是流式处理法呢

流式处理是一种处理数据的方式,它允许你在数据到达时立即处理,而不是等待所有数据都到达后再处理。这种方式特别适合处理大量数据,因为它不需要一次性加载所有数据到内存中。 在C#中,你可以使用
yield return
关键字来创建一个返回
IEnumerable<T>
的方法,这个方法可以在每次迭代时返回一个元素,而不是一次性返回所有元素。这就是一种流式处理的实现方式。
举个例子:
1 private IEnumerable<DataRow>GetDataFromSource()2 {3         using (SqlConnection sourceConnection = newSqlConnection(sourceConnectionString))4 {5 sourceConnection.Open();6 
7             using (SqlCommand command = new SqlCommand("SELECT * FROM YourTable", sourceConnection))8 {9                 using (SqlDataReader reader =command.ExecuteReader())10 {11                     DataTable dataTable = newDataTable();12 
13                     while(reader.Read())14 {15 dataTable.LoadDataRow(reader.GetValues(), LoadOption.Upsert);16                         DataRow row = dataTable.Rows[dataTable.Rows.Count - 1];17                         yield returnrow;18 dataTable.Clear();19 }20 }21 }22         }
在这个示例中,
GetDataFromSource
方法每次迭代时返回一个
DataRow
,而不是一次性返回所有
DataRow
。这样,你就可以在每次迭代时处理一个
DataRow
,而不需要一次性加载所有数据到内存中。
但是

如果你的数据处理需要跨行操作,你可能需要使用其他的方法了,这个就不适用。
扫盲:yield一次只返回一个难道就不会多次访问数据库了吗?
在这个示例中,
yield return
并不会导致多次访问数据库。实际上,数据库查询只执行一次,然后使用
SqlDataReader
逐行读取结果。
yield return
只是在每次迭代时返回一个
DataRow
,而不是一次性返回所有
DataRow
。 当你在
foreach
循环中迭代
GetDataFromSource()
方法时,每次迭代都会从上次停止的地方继续,直到
SqlDataReader
读取完所有行。这意味着,虽然你每次只处理一个
DataRow
,但数据库查询只执行一次。
既然已经看到这里了,我们可以继续再考虑下关于性能优化,我们还能从哪些方面着手呢?
1. 代码层面:
- 使用更高效的数据结构和算法。
- 使用缓存避免多次数据库交互
- 减少不必要的计算和内存分配。
- 利用并行和异步编程提高性能。
- 使用性能分析工具定位和优化瓶颈。
2. Web API方面:
- 使用HTTP缓存减少不必要的请求。
- 使用Gzip或Brotli压缩减少响应大小。
- 使用分页、排序和过滤减少返回的数据量。
- 使用GraphQL或OData让客户端可以指定需要的数据。
3. 数据库方面:
- 使用索引加速查询。
- 使用批量操作减少数据库交互次数。
- 使用读写分离和数据库分片提高并发性能。
- 使用缓存减少数据库访问。
4. Nginx方面:
- 使用反向代理和负载均衡提高并发性能。
- 使用缓存减少后端服务器的负载。
- 使用Gzip压缩减少网络传输量。
5. CDN方面:
- 使用CDN加速静态资源的访问。
- 使用边缘计算将计算任务靠近用户。
6. 微服务方面:
- 使用服务间的异步通信减少等待时间。
- 使用服务的横向扩展提高并发性能。
- 使用服务的分区设计提高可扩展性。
- 根据业务需求,考虑使用redis、rabbitmq、mangoDB等等中间件
7. 其他方面:
- 使用自动扩缩容的云服务应对流量波动。
- 使用性能监控和日志分析工具定位性能问题。
- 使用容器和Kubernetes等技术提高部署和运行的效率。
- 使用链路追踪SkyWorking具体查看哪条链路的性能瓶颈
性能优化本身就是一个非常庞大的话题,需要具体问题具体分析,总的来说是,平常能用到的就是以上总结的这些点。技术永远是为业务服务的,根据不同的业务选择合适的技术是高级开发者必须要考虑的问题。今天分享就这些了,关于性能优化大家还有那些经验可以评论区分享!

第一章 简介


太赫兹波是介于微波和光波之间的光谱区域,频率从 0.1THz ~ 10THz 之间,波长在 3mm ~ 30μm 之间。提供大块连续的频带范围以满足对 Tbit/s 内极高数据传输速率的需求,使该区域成为下一代无线通信(6G)的重点研究领域。预计在 2030年 左右实现商业部署,太赫兹区域在 成像、光谱学 和 传感 等许多应用领域显示出巨大的前景。

这一频率范围的解密涉及到跨学科的研究,射频电子与高频半导体技术密切结合,但也包括使用光子技术的替代方法。本白皮书重点介绍 6G 通信,简述太赫兹波的基本原理、应用特性。

第二章
介绍了关键的 6G 性能要求和研究领域。

第三章
讨论了潜在的应用,如基于太赫兹的通信和传感。这些应用需要将频谱扩展到 100GHz 以上,太赫兹波与空间物质发生的相互作用以及影响。

第四章
重点介绍了发射太赫兹波的各种方法。除了使用电子 MMIC 外,基于光子技术的替代方案将在未来发挥关键作用。特别是随着今天的实验室装置小型化为光子集成电路(PIC),这些方案可能成为主流。

凭借其既定的生产工艺和高水平的集成,通过电子产生太赫兹仍然是目前的主要技术。频率限制正不断得到突破。

第五章
总结了高频半导体技术的现状。

2023年国际电联世界无线电大会(WRC23)上,预计将讨论在随后的 WRC27 中分配 100GHz 以上的额外频率范围。目前正在讨论的话题是太赫兹的应用潜力。

为了充分挖掘太赫兹的潜力用于未来通信标准(6G),定义测量指标、研究不同半导体材料的特性至关重要,这是标准化流程的第一步。

第六章
描述了信道传播测量的概念,并介绍了在慕尼黑罗德与施瓦茨总部进行 158GHz 和 300GHz 信道测试的一些初步结果。

第二章 走向下一个无线通信标准 —— 6G


2.1 从 5G 走向 6G —— 愿景与关键技术


建立全国性的 5G 网络,并不断提供新的通信能力和服务,全行业为此忙碌多年。 5G 为工业4.0 等新的应用场景打开了大门,具有代表性的服务包括:增强型移动宽带(eMBB)、 超可靠低延迟通信(URLLC)、大规模物联网(mMTC)。虽然 5G 服务将进一步向 3GPP Release18 演进阶段继续发展,但学术界和工业界已经启动了对下一代无线通信(6G)基础的研究。计划在 2030年 左右落地商用,预计商用发布会可能提前一年进行。在这里,我们对 6G 愿景和不同技术方案做些简单阐述。

WP 5D 是国际电信联盟 ITU(ITU-R)的 5D工作组,于 2021年 开始制定新的建议文件草案《IMT 2030年及以后的愿景》,以确定 IMT2030+(最终将被称为 “6G”)未来发展的框架和总体目标。预计第一批 3GPP 标准化工作将于 2023/2024 年 展开,首先定义的是技术性能要求。标准的定义工作将从 2026/2027 年 开始。

很难预测哪些应用和场景最终成为下一代无线标准的主要驱动力,而这些应用和场景又将塑造 6G 的技术目标(KPI)。潜在的应用场景包括:全息应用、扩展现实 XR(AR、VR、混合现实 MR)或数字孪生,这些应用对数据传输速率和延迟提出了极其严格的要求。其愿景是,在 6G 时代,数字、设备 和 人类世界 将 无缝融合(Cyber-Physical Fusion),从而形成一个互联世界,在这个世界中,通信将 人、设备 和 服务 与我们日常生活的所有必要部分组合起来。部署的 传感器 和 执行设备 需要以 极高的速率 安全地 传输 和 处理 数据,以实现这种“沉浸式通信”。

表1 对 6G 的目标(KPI)定义了一个严格的范围。比 5G 高 10倍 ~ 100倍,这将对无线通信和传输网络提出新的挑战。

在某些时间敏感的同步控制应用中(例如在工厂自动化等工业应用环境中),端到端 的 一致性 和 确定性 非常重要,即 低抖动,而不只是 净延迟。这是作为一个新的 KPI 引入的。通过无线技术实现 时间同步 和 相互定位,使远程设备协同工作。

表中1 第三行:User plane latency (in ms) 是为此新增的延迟波动指标。

新的 6G 通信标准会成为 以人为本、可持续影响全社会 的重要基础。将会覆盖人类的 生活、通信领域。 例如,联合国可持续发展目标的指导方针,以能源和资源向偏远地区提供 平等、负担得起 和 可扩展 的服务。目前的网络能源已经引起了人们的广泛关注 —— 包括对 环境的影响、以及 网络运营商 OPEX 的重大影响。为了应对数据通信的指数级增长,必须降低传输信息所消耗的能量。

2.2 6G 研究领域

图1 概述了已确定的主要 6G 研究领域(尽管不全面),以及实现愿景 和 未来无线通信的用例。

尽管部分技术只是在前几代基础上做了迭代,但仍有很多技术具有颠覆性,可能会释放出 超出香农极限 的潜力。

前几代已经使用的技术的演进

一些演进的技术步伐,如替代 OFDM 或 全双工操作 的新波形,此前曾针对 5G 进行过讨论,但并未包含在标准中。

超高速信道编码

信道编码是无线通信中 纠正传输错误 的基本组成部分,是可靠性的关键。同时,它也是基带处理的一个复杂部分,为实现在极高的 吞吐量、可靠性、低功耗 等方面的新 KPI,要求对现有信道编码方案进行增强,如 Turbo、 LDPC 和 极码 等。

新的波形和多址接入

波形设计对无线系统的高效运行至关重要。虽然 OFDM 是 6G 波形的有力候选方案,但仍需要探索备选的特定波形或统一可扩展波形,例如 通感一体化。

此外,还必须考虑到不同的频谱范围、设备特性(相位噪声、 PA功率效率)和 系统特性(信号带宽)。目前正在考虑许多新的波形,包括用于具有 多普勒扩展的高迁移率场景的正交时频空间调制(OTFS)。此外,单载波波形可能在满足未来设备对功率的要求发挥更大主导作用。为了允许更灵活地使用无线信道,可能参考 非正交多址(NOMA)放宽正交性约束。

超大数量的 MIMO

5G 引入了大规模 MIMO。目前的趋势是更高频率和更短波长,需要在小片区域内增加天线数量,以提供更多定向波束来弥补高频损耗。

另一种提高频谱效率的方法是自干扰消除技术,用于 带内双向通信和中继 的全双工通信。

全新的网络拓扑结构

当前网络架构中使用的蜂窝布局旨在最大限度地减少区域边界处的干扰。然而,为了实现超高速、高容量(特别是连接“云AI大脑”)和高可靠性通信,理想的方式是低损耗的短距离通信,并在多个通信路径上增加冗余。

这种空间分布式拓扑可能涉及 Cell-Free Networks,其中基站(分布在大面积上)协调相关联合传输向每个用户提供独立服务。这种方法为不同位置的用户带来更高的信噪比和增益,以及更一致的体验质量。然而,落地需要高度复杂的计算和基站之间的严格同步,以及站点之间大量数据的交换。

为了向 无人机、飞机、船舶 和 空间站/卫星 提供新的服务,从而将覆盖范围扩大到 偏远地区、海洋 和 太空,有必要对网络覆盖范围进行三维扩展。因此,除了水平部署外,还包括垂直方向的部署。例如,利用无人机(位于 20公里高度平流层的高空平台站或HAPS)和 低轨道(LEO)卫星作为空中移动基站 建立非地面网络(NTN)来实现这种无处不在的通信。

太赫兹通信和感知

6G 的关键技术概念之一 —— 尽管只是 6G 的促成因素之一(使用太赫兹波进行通信和感知)。这些太赫兹应用和技术将在以下章节中详细讨论。 释放亚太赫兹和太赫兹频率范围(100GHz ~ 3THz)几个GHz的极高带宽潜力,是目前研究的方向。除了无线通信中的超高数据速率外,这也将有利于感知和成像应用以及未来可能的医疗诊断程序。

联合通信和感知(JCS)的概念 —— 有时被称为集成通信和感知(ICAS),作为物理层设计的一部分,即联合使用的波形和网络架构,在本地支持这两种应用。它不仅限于太赫兹率,而且还包括毫米波(mmWave)范围。宽频带也将有利于高精度感知应用。这些应用不仅包括 定位、目标检测 或 高分辨率雷达,还包括对环境感知特别敏感的光谱型分析。

光子技术和可见光通信(VLC)

目前光学无线通信作为一种补充技术已经应用于部分领域,它结合了 高速、高保真度 和 低部署成本 等特点,未来会更加普及。与基于射频的接入网相比,主要优点是在可见光和红外波长上可获得约 300THz 的免授权带宽,抗干扰能力强,通信安全,例如在射频辐射不能穿透墙壁的室内环境中。具有红外波长的自由空间光通信(FSO)使用调制激光二极管通过自由空间传输信息,作为回程解决方案或用于卫星之间的天基通信。然而,它会受到 天气条件、大气湍流,尤其是 雾 的影响。

在可见光通信(VLC)中,也被称为“光保真度 ”(LiFi),数据通过商用照明LED的高带宽强度调制来传输。光电二极管充当接收器,这是一种经济高效的方法,可以轻松集成到现有的基础设施中,主要用于可视的室内应用。

严苛的 6G KPI 也将推动未来交通网络的发展 。例如,创新性光与无线网络全球论坛(IOWN GF)旨在为计算和通信网络架构研发各种技术,以同时实现可扩展性、零星的负载波动、能源效率和延迟可管理性。 光子技术 为应对这些挑战提供帮助:提出的开放式全光子网络(APN)有助于简化数据传输和处理,实现大容量、低延迟和低能耗的基础设施。例如,它以最小的光电转换实现跨 域/层次 的直接端到端光路连接,以提供低延迟服务。集成光器件(光子集成电路, PIC)可以提供路由和终端连接功能来实现这样的端到端全光链路。

此外,推测 2030年 信容量需求增加至 Pbit/s 级,长途传输将需要 Pbit/s 级通信容量。目前单模光纤(SMF)的极限在 100tbit/s 左右。使用多芯光纤传输技术(将多个芯嵌入到单个玻璃光纤中)的超宽带光传输,以及通过复用和添加新的光带进一步增加波长数量,可以进一步提升容量极限。

另一种光子技术是量子通信(和量子网络)概念在25年前首次得到证实,最近引起了广泛关注。这可以作为 6G 技术的补充,作为确保 超安全和可靠通信 的一种可行方案。量子通信通过交换纠缠光子提供了一种固有安全的 量子密钥分发(QKD)方式。这些数字密钥随后将用于传统的加密传输。这些技术可以通过光纤进行集成和传输。然而,卫星和地球之间的自由空间 量子秘钥分发(QKD)也得到了验证,这为实现未来量子通信网络提供基础。

可重构智能表面(RIS)和超材料

当安装在建筑立面或室内环境时,使用 可重构智能表面(RIS)可以将无线信号的能量引导到某一点,从而在非视线环境中提供更好的覆盖并减少能耗。

从无线通信的早期开始,传播信道就被认为是发射器和接收器之间 随机的、根据场景而动态变化的实体。由于周围环境和物体以及接收器的移动性,它会以一种不可控的方式降低接收信号的质量。通信理论中的一个基本假设是:传播信道是通信系统既定条件,不受影响。可重构智能表面(RIS)的使用可以改变传播通道,从而在无线通信网络中引入一种新的可编程实体,并有望将边界扩展到香农极限之外。

可重构智能表面(也称为智能反射表面 IRS)是一种平面结构,其设计具有能够动态控制电磁波的特性。 IRS 由大量低成本的无源(因此低能量)元件组成,每个元件都以一定的相移反射入射信号协同实现波束赋形,并抑制一个或多个指定接收器的干扰。这种 RIS 的构建模块是所谓的超材料,与基于原子成分特性的材料相反,超材料是一种工程构,以所需的方式与电磁辐射相互作用,并具有特殊性能。它们通常由一组小于目标波长的结构组成。

RIS 场景是主要在室内环境(商场、机场、体育场或工业/工厂环境)中部署超密集网络。

2021年10月,欧洲电信标准协会(ETSI)在可重构智能表面(ISG RIS)上启动了一个新的行业规范组(ISG),用于评审和建立 RIS 技术的全球标准化。正如目前在 3GPP R18 中讨论的那样,智能中继器可能是通向反射智能表面的基石。

分布式计算和人工智能(AI)通信系统

虽然未来的 6G 应用场景仍需定义,与 5G 相比很显然,在 数据速率、延迟、频谱效率、安全性、可靠性 和 能耗 等方面的性能要求将更加苛刻。这也将影响 处理架构:信息技术和通信技术将进一步融合,即大量的数据处理将在分布式网络系统中进行,而不一定在最终的用户设备中进行。这将导致具有挑战性的数据速率和延迟要求。计算能力可以脱离到与设备分离的云或边缘网络(从而降低终端成本)。

在传统的 “冯·诺伊曼” 计算体系结构中,计算单元(CPU)和存储器是分开的。能耗和延迟成为 在CPU和内存之间传输大量数据的瓶颈。从人类大脑中获得灵感的 神经形态计算(Neuromorphic Computing)等架构实现低延迟的高能效处理,计算任务是在存储器内部执行的。以人类大脑为例,它的计算能力相对于功耗是非常理想的(总共为 20w ~ 30w)。

与人工智能相关的任务严重依赖于计算处理能力。图形处理单元(GPU)性能的进一步提升最终将受到可用能量的限制。对于这样的任务,内存计算的模拟AI内核特别合适。 各种新的概念,如模拟3D交叉点电阻器阵列,用作非易失性存储器来存储权重(例如用于卷积神经网络),可用于矩阵向量并行计算(神经网络的流行计算类型)。

AI与机器学习

今天,人工智能(AI)和机器学习(ML)已经被用于许多网络应用程序的自我管理和控制操作。其中包括初始网络规划阶段、网络控制和优化(如流量管理)、动态频谱管理以及预测和自适应资源分配。

预计在未来,AI将成为无线通信系统各个领域不可或缺的一部分。这可能包括适应特定传播信道和环境条件的物理层设计,并具有端到端优化的可能性 —— 而不是优化无线传输链的每个组件。为了应对未来 6G 网络在 设备类型、频谱范围扩展 和 灵活网络拓扑(如协作网状网络)方面的复杂性增加, AI和机器学习将在 6G 的部署和运营中发挥重要作用。最大限度提升用户体验和成本效率,最少能耗地提升系统性能。

最近,欧洲电信标准协会(ETSI)也开始在在监管角度关注 AI的测试 和 AI系统测试。相关工作组是 ETSI 技术委员会(TC)核心网络和互操作性测试(INT)工作组 和 ETSI技术委员会(TC)测试和规范方法(MTS)工作组。

第三章 太赫兹波的性质与应用

3.1 毫米波和太赫兹频率的新6G频谱

在通往太赫兹频谱的路上

5G 率先使用每个组件载波高达 400MHz 的大带宽毫米波频率,以实现无线工厂自动化等要求苛刻的实时应用所需的传输速率,而新兴的 6G 技术旨在实现更高的传输速率和更低的延迟。

然而,带宽为几GHz的超高数据速率的大连续频率范围只能在亚太赫兹和太赫兹范围内使用,即 100GHz 以上(图2)。

香农-哈特利定理给出了最大可实现信道容量(在噪声影响下)的边界为 C = B·log2 (1 + S/N),其中 C为容量(bit/s), B为带宽(Hz), S/N为信噪比,该定理指出最大可实现数据速率与带宽B 成正比。因为低于 6GHz 的频率已经大量使用,所以 5G 将频率范围扩展到毫米波范围。为了进一步提高未来的无线标准(如6G)的数据速率,将挖掘太赫兹频率范围几个GHz的大连续带宽。图2 显示了为未来无线通信分配或考虑的不同频率范围。

图2: 5G 和 6G 的新频谱

在毫米波和太赫兹频率范围内有充足的频谱资源,其中包含了可用于无线通信的频带。FR1 和 FR2 中的 5G 频段分布在 71GHz 以下的范围内。6G 的研究主要集中在 D频段 和 H频段。

在 4G(LTE)之前,只有 6GHz 以下的频率范围被用于无线通信。由于其有利的传播条件和可以实现的区域面积,该频率范围至今仍发挥着关键作用。

在 3GPP 5G NR 命名法中,该频率范围称为 5G FR1(410MHz ~ 7.125GHz)。该范围还包括 LTE 和 Wi-Fi,如 Wi-Fi 6(IEEE 802.11ax)和 Wi-Fi 7(IEEE 802.11be)。

在 3GPP R17 中,5G FR2(深蓝色部分)被分配到最高 71GHz(24.25GHz ~ 71GHz)。

对于 5G 的演进(图2 中的 “Beyond 5G”),正在考虑 71GHz ~ 100GHz 的更高频率:浅蓝色频率范围是国际电信联盟(ITU)2019年世界无线电大会考虑的未来无线通信的频率范围(例如 81GHz ~ 86GHz)。虽然最初考虑了 80GHz 频段,但没有批准用于 IMT-Advanced(5G)。该频率范围还包含 60GHz 未授权频段(E频段从 60GHz 延伸到 90GHz)。

亚太赫兹波段

为了实现 6G 的 TB级 数据速率甚至更高的带宽,我们只能使用超过 100GHz 的频率范围。已经确定的新频段:D频段(110GHz ~ 170GHz)、 G频段(140GHz ~ 220GHz)和 H/J频段(220GHz ~ 330GHz)。

ITU 无线电规则文件总结了 1995年 世界无线电通信大会(WRC-95)通过并由随后的世界无线电通信大会(WRC-97、 WRC-2000、 WRC-03、 WRC-07、 WRC-12、 WRC-15、WRC-19)审议的无线电规则。正如引用附件[22]中第 185页所述,275GHz ~ 3THz 的区域目前尚未正式分配。275GHz ~ 450GHz 频率范围固定和地面无线服务的操作:确定 275GHz ~ 296GHz、306GHz ~ 313GHz、318GHz ~ 333GHz、356GHz ~ 450GHz 归管理部门使用,用于实施各种地面无线和固定服务应用,其中地球探测卫星应用无需采用特定条件进行保护。

IEEE 的标准化活动目前正在进行中,其中一个小组正在讨论这些频率范围下 100Gbps 的标准。该标准专门针对 252GHz ~ 325GHz 的频率范围,信号带宽高达 69.12GHz。在 95GHz 左右的 W频段(75GHz ~ 110GHz)中,已经开始开发用于无线回程/接入太赫兹频率范围。下一个极高的候选频段,即 110GHz ~ 170GHz 的 D频段,正被基站基础设施供应商所关注。 6G 的研究工作目前集中在 300GHz 左右的 D频段 和 H/J频段。由于 WRC27 的议程将在 WRC23上确定,因此在 2023年 WRC23之前,通过可行性研究和信道传播测量(第六章)来展示太赫兹通信的全部潜在价值。

7GHz 以上(7GHz ~ 24GHz)

尽管人们对亚太赫兹频率范围有着浓厚的兴趣,但位于 FR1 和 FR2 之间的 7GHz ~ 24GHz 频率范围仍然提供了潜在的大量可用频谱(图2),它可以提供一个 “最佳点” —— 与 FR1 的频率范围相比,在更小的封装中提供更高阶 MIMO,与 FR2 频率范围相比,它具备更好的传播特性。因此,该频率范围可能是 6G 的候选区域。

3.2 太赫兹应用

3.2.1 大量的应用有待探索

太赫兹(THz)波位于光学和微波领域之间的频谱部分。太赫兹光谱学早期用于天体物理观测和环境监测的高灵敏度仪器。然而,随着光子学和纳米技术的迭代使太赫兹能够应用于更多的领域。

光谱学和成像:
由于许多形式的凝聚态物质、分子化合物、水蒸汽和大气具有与太赫兹波共振的不同物理特征,太赫兹波显示出巨大的前景,并已用于光谱学和高分辨率成像的许多领域。利用太赫兹光谱技术可以很容易地识别许多物质和复杂分子,如 药物、生物分子、蛋白质。图3 显示了一个常见药物分子示例,其中太赫兹频率的吸收光谱可以用来区分两种主要的分子变体。基于太赫兹光谱技术的传感器还能用于安全保障,因为常见的爆炸物或麻醉品可以通过它们的 “光谱指纹” 来识别。太赫兹波可以对产品进行无损检测,并可以 “看到” 塑料、纺织品、纸张 等。与 X-Ray 不同,太赫兹波没有任何电离效应,普遍被认为在生物学上是无害的。因此,它们在使用时不需要任何额外的安全措施。

通信:
数据流量呈指数级增长,互联网流量在 2017年 已经超过 每月 100EB(10^18 Byte)。预计到 2022年,这一数字将增至三倍。 由于数据流量增长最快的部分与无线信道有关,因此这种网络容量的增长需要更高的无线传输链路。提供大规模连续频段以满足对 Tbit/s 范围内低延迟的极高数据传输速率需求,使其成为 6G 无线通信的关键研究领域。

感知和定位:
还有一个概念正在出现,它将无线频率用于通信和感知能力,即联合通信和感知(JCS,第2.2章)。太赫兹频率不仅可以承载通信数据,还可以像高精度雷达系统一样探测物体。通过这种方式,太赫兹传感可以提供高分辨率的环境地图和厘米/亚厘米级精度的定位信息。例如:工业控制、监控应用、机器人、虚拟现实。

图3:太赫兹波在通信和感知、光谱学和成像中的应用

左图:莱布尼茨高性能微电子研究所(IHP)的 D波段 雷达芯片。中间图:对双氯芬酸样品的太赫兹光谱进行分析,可以区分药物的两种主要形式,或多晶型。右图:使用 R&S®QPS100(70GHz ~ 80GHz)拍摄的微波成像。

3.2.2 用于大气遥感和天体物理学应用的太赫兹波

根据普朗克黑体辐射定律,太赫兹光子的能量对应于 几个开尔文到几十开尔文 的温度。因此,太赫兹天文学研究探索了寒冷的宇宙,如星际物质的分子云。新恒星诞生的区域引发广泛关注。 1970年 一氧化碳(CO)因在 115GHz 的太赫兹范围内发生跃迁而成为人类从星际云中检测到的第一种分子,开始了太赫兹天文学时代。

Radiometer Physics GmbH(RPG,罗德与施瓦茨公司)起源于 马克斯·普朗克 射电天文学研究所 和 美国宇航局喷气推进实验室,早期就参与了这项科学研究。该公司一直研发 太赫兹遥感、毫米波、亚毫米、太赫兹仪器 等尖端仪器。

对于使用毫米波和亚毫米波仪器研究行星(地球、木星、金星、火星等)大气动力学的科学家和气象学家来说,他们对分子物种的吸收和发射特性(参见 图7 中的地球大气示例)特别感兴趣 。根据应用和科学目标, 使用各种类型的无源仪器,常见的有 18GHz ~ 664GHz 范围内工作的辐射仪,0.3THz ~ 1.2THz 范围内工作的光谱仪, 以及在 35GHz ~ 94GHz 范围内工作的 FMCW雷达 和 在 166GHz 范围内工作的闪烁辐射仪。这些仪器可以从地面站操作,也可以从太空卫星操作。图4 显示了用于 大气遥感、行星科学 和 天体物理学 的 无源辐射仪、主动辐射源 和 有源雷达仪器 的示例。

在过去的十年中,RPG公司 已经为冰云成像仪(ICI)开发了 183GHz ~ 664GHz 范围的太赫兹外差接收机,这是一种由 空客(Airbus-ASE)公司为 欧洲航天局/欧洲气象卫星组织(ESA/EUMETSAT)开发的第二代多通道扫描辐射仪(MetOp-SG,图4 左)。它是欧洲提供天气数据服务(例如 海面风矢量和地表土壤湿度)的一项设备,以监测并改善 2023年 ~ 2043年 气象预报的准确性。水蒸气以潜热的形式携带能量、破坏性风暴、加速气候变化。自 2000年 以来,随着海洋和大气温度的升高,全球大气中的水蒸气量增加了约 4%,导致风暴迅速地加剧,密切监测温度、蒸汽和风对于预测天气模式是非常有价值的。

对于 ESA 木星冰月探测器(JUICE)计划(图4 中间),RPG公司 为亚毫米波仪器(SWI)开发了 132GHz ~ 158GHz 范围的大功率源,这是一个由 马克斯·普朗克 研究所为太阳系研究(MPS)开发的双通道 0.6THz ~ 1.2THz 光谱仪。 JUICE 任务计划于 2023年 发射。它将花费至少三年的时间对巨大的气态行星 —— 木星,以及三个最大且富含水的卫星(木卫三 盖尼米得、 木卫四 卡里斯托、木卫二 欧罗巴)进行详细观察。同样令人感兴趣的是 木星大气和磁层的特征。

这两种仪器(用于 MetOp-SG 和 JUICE任务)的基础技术在很大程度上依赖于 GaAs 半导体器件(放大器、乘法器、混频器)、高精度制造和组装技术(喇叭天线、射频模块),这些技术符合太空任务所需的最严格要求。

图4:太赫兹波在大气遥感和天体物理学领域的应用示例
左图:空间被动辐射仪冰云成像仪(ICI)多通道接收器(RX),工作在 183GHz ~ 664GHz 范围内(交付的飞行模型)(图片由 RPG / 空中客车 / ESA / EUMETSAT 提供)。中图:ESA JUICE 任务用于行星科学的亚毫米波仪器(SWI)光谱仪开发的 132GHz ~ 158GHz LO源(TX)示例。右图:用于云传感的 94GHz FMCW 雷达仪器和用于现场蒸发传感的 166GHz 闪烁辐射计仪器。

3.3 用于通信的太赫兹波:有哪些潜在的用例场景?

使用吸收窗、功率和天线阵列来实现指向性

毫米波的技术挑战在太赫兹范围内更为明显。这包括更高的路径损耗和更短的适用范围。与 5G 中的毫米波类似,这些问题可以通过波束赋形 波聚焦来缓解。更短的波长还有一个优点,就是可以在更小的空间中封装更多的天线,从而产生高度精确的波束。

太赫兹频率超高速通信的主要用例之一涉及高容量前端和回程点对点(准静态)通信链路,也适用于偏远地区的基础设施(使用高增益天线或天线阵列)或 “最后一英里” 连接。期望在几公里的距离内可以支持高达 100Gbps 的容量。此外,窄波束还可以实现非常密集的设备部署。另一种应用包括短距离通信,如超高速自助亭(kiosk)下载,或芯片对芯片通信(图5)。

如今数据中心已成为企业不可或缺的计算基础。当代数据中心网络主要依靠铜缆或光纤进行机架内或机架间的网络连接,这涉及到布线的复杂性。太赫兹无线链路可以大幅提升设计的灵活性,并降低部署成本。

虽然室外和室内都可适用太赫兹,但室内场景很可能成为太赫兹应用的主流。在室内环境中,太赫兹频谱的短距离和弱穿透能力将成为优势。例如,太赫兹通信可以高度安全,因为它可以被限制在特定的室内空间。

图5:太赫兹通信用例

3.4 电磁波谱和相关应用

图6 展示了电磁波谱和各种应用,从低频端的广播、蜂窝通信到最高能量(以及频率)的 X-Ray 成像 和 γ-Ray 治疗。太赫兹频谱位于 电子学 和 光子学 两个领域的交界处。各文献对太赫兹频率范围的定义有所不同,但 IEEE 和 ITU 的定义是 300GHz ~ 3THz(THF或极高频率),刚好高于毫米波频率范围(30GHz ~ 300GHz,EHF或极高频) 和 微波频率范围(3GHz ~ 30GHz;SHF或超高频)。然而,在出版物中,100GHz ~ 10THz 的频率范围通常被表示为太赫兹频率。从 100GHz ~ 300GHz 的频率范围也通常被称为 亚太赫兹(sub-THz)频率。

图6:太赫兹频谱在电子和光子学之间电磁波谱和应用

3.5 太赫兹波与物质的相互作用

太赫兹波的能量相对较低(低至光波能量的 1/100 至 1/1000),不会引发任何化学结构变化。它位于气体的分子旋转跃迁 和 弱键的振动跃迁区域。因此,太赫兹波可以通过衰减低的 干燥、非金属 和 非极性材料传播。 这种能力,加上它的波长小(相对于微波) 和 光子能量低(相对于 X-Ray),也使太赫兹波成为非电离医学成像的理想选择,如烧伤评估或皮肤癌诊断。

图7 展示了 毫米波 和 太赫兹频谱 内的特定大气衰减情况。共振频率反映了大气中存在的各种分子的旋转激发光谱。大气衰减随工作频率的增加而稳定增加。在这些谐振频率之间,存在着许多 “大气窗口”,可用于各种应用。此外 183GHz(G波段)用于水汽探测;140GHz ~ 220GHz 用于远程湿度传感(探测冰)。M87星系中心黑洞的第一张直接照片是亚太赫兹波段射电天文观测的一个案例。在 230GHz 频率上,事件视界望远镜(EHT)阵列通过协同分布在地球不同位置的射电望远镜探测信号。

图7:毫米波和太赫兹频谱内的大气衰减比

在气压为 1013hPa,温度为 +15℃,水蒸气密度为 7.5g/立方米 时。大气中存在的不同分子(即 水、氧)的旋转激发在吸收光谱中得到反射。

毫米波和太赫兹波用于无线通信链路

如 图2 所示, 24GHz ~ 30GHz 和 37GHz ~ 40GHz 频率范围是 5G 蜂窝网络的毫米波区域。此外, 43GHz ~ 50GHz 和 60GHz 左右的频率用于卫星通信链路。由于氧分子的共振,在 60GHz 以下的传播损耗增加,为室内应用(WLAN)建立高数据吞吐量的安全无线链路提供了可能性。

太赫兹挑战:100GHz 以上频率的路径损耗

下一代通信标准 6G 预计也将严重依赖于 100GHz 以上的组件,例如 D频段(110GHz ~ 170GHz)或 H/J频段(220GHz ~ 330GHz)。

自由空间路径损耗与信号频率 ν的平方 成正比。例如 280GHz 的链路 与 28GHz 的链路相比,有 20dB 的额外路径损耗。

然而,有一种常见的误解,即增加无线链路的载波频率将不可避免地导致更高的信道损耗。这只有在发射机(TX)和 接收机(RX)都是全向天线的假设下才成立。太赫兹波段的路径损耗可以通过在基站中使用非常大的天线阵列来克服,即超大规模 MIMO (图1)。

无线链路的
自由空间路径损耗(FSPL)
由弗里斯方程描述

其中,d 为 TX天线 与 RX天线 间的距离,λ 为 工作波长,GRX、GTX 分别为发射机和接收机的天线增益。假设 TX 和 RX 之间的距离以及它们的天线增益是固定的,FSPL值 随着频率 ν = c/λ 的增加呈二次增长。 图8(左)说明了这种关系,即在全向天线(GRX = GTX = 1)的情况下,TX 和 RX 在三种不同频率下的 FSPL 和 距离。

图8:毫米波无线链路的理论 弗里斯自由空间路径损耗

左图:TX 和 RX都是全向天线的场景。右图:TX 和 RX 都有固定有效孔径为 1平方厘米 的定向天线场景。

天线增益 G ant 取决于天线的有效孔径 A eff,它与天线的物理尺寸成正比,也与波长成正比:

工作频率为 35GHz、70GHz 和 140GHz 时,一个固定有效孔径为 1平方厘米 的定向天线理论上增益分别为 12.3dBi、 18.4dBi 和 24.4dBi。因为天线的物理尺寸不变,所以天线增益随频率的增加呈二次增长。

我们结合最后两个方程可以得出结论,通过在发射端或接收端使用具有固定有效孔径的定向天线,FSPL 与 载波频率 无关。因此,与较低载波频率的系统相比,采用高度定向和可操纵的天线应该能够使无线通信链路在更高频率(具有更高的带宽和吞吐量)下工作,且不会因大气衰减而引起信噪比的显著降低。

第四章 太赫兹产生的电子与光子技术分析

4.1 从电子学到光子学

在过去的二十年中,太赫兹(THz)学科 填补了微波电子学和光子学之间的频率空缺,在传感、成像和数据通信领域拥有巨大潜力而吸引了越来越多的广泛关注。自从 100年前 开创了 电气 和 光学/红外区域 之间的工作以来,人们一直积极追求高效、稳定和紧凑的太赫兹源和接收器,并使太赫兹科学成为现实。

4.2 消除 “太赫兹间隙”

在通信中,0.1THz ~ 10THz 的频率范围仍然是一个待开发领域。然而,这一领域的研究最近引起了越来越多的关注,因为这些高载波频率与前所未有的信道容量有关。

在过去很长一段时间里,很难产生密集的、定向的太赫兹辐射,太赫兹范围被认为是电磁频谱的最终的前沿领域。主要的技术限制即所谓的 “太赫兹间隙” ,如 图9 所示,绘制了各种电子和光子器件的太赫兹发射功率与频率的函数关系,将在后面篇幅进行更详细的讨论。显然,太赫兹频谱在 0.1THz ~ 10THz 的范围内,功率呈下降趋势。

主要是由于损耗过大和载流子速度有限,对于电子设备来说太赫兹频率太高了。另一方面,由于缺乏具有足够小的带隙材料,它们对于光子器件来说太低了(见第 4.4章)。

尽管在电子器件(例如 高迁移率半导体材料) 和 光学元件(例如 具有低温冷却的量子级联激光器)方面已经做出了重大努力,但太赫兹区域周围的可用功率仍然远低于其他频谱区域。类似的趋势也发生在信号检测中,这样的差距使最近二十年的频谱发展难以满足当今世界与日俱增的需求。

图9:太赫兹发射功率与频率的关系

实线表示传统的太赫兹源:IMPATT(碰撞电离雪崩渡越时间二极管),MMIC(微波单片集成电路),TUNNET(隧穿渡越时间二极管)。

椭圆表示最近开发的太赫兹源:THz-QCL(量子级联激光器),RTD(谐振隧穿二极管),UTC-PD(单行载流子光电二极管)。

4.3 电子学和光子学交界的太赫兹辐射源

产生太赫兹(THz)辐射有三种主要方法(图10)。下面几节将更详细地举例说明。

电子源

随着各种半导体材料组件的改进(参见 第5章),使用电子源的“经典”方法在过去几年中发生了巨大的变化。

这些源包括 倍频链(上变频)、谐振隧穿二极管(RTD)、晶体管、二极管。其优点是元件非常紧凑、可以在室温下工作,但在带宽和效率上有一定的限制。然而,电子源在太赫兹频率下相对低效,提供的频率调谐相当有限。

直接生成太赫兹波:QCL

用光源直接产生太赫兹波的方法包括:非常优雅的 量子级联激光器(QCL)方法、非线性光学方法(光学参量过程)、分子激光器方法(低效且笨重)。虽然利用 量子级联激光器(QCL)可以达到相当合理的功率水平,但效率仍然有限,并且通常必须在低温下工作。

间接产生太赫兹波:光电子器件

近年来,0.5THz ~10THz 之间的频率也被列入激光技术的领域。光电子(光子)方法要么使用 可调谐二极管激光器,要么使用 飞秒激光器。光混合器、光导开关或非线性晶体把近红外激光转换成 光谱分辨太赫兹波 或 宽带太赫兹波。

在过去几年中,使用超快光电二极管和光电导体从光频区进行“下变频”引起广泛关注。主要优点是可在大范围内调谐、可在室温操作,可以重复使用为光纤通信已有的成熟技术。在功率上有较大突破,但能效上有诸多限制。

图10:产生太赫兹辐射的三种主要方法

请注意,1THz 的能量当量对应于 49k,由于在较高温度下的弛豫过程,某些技术(如:量子级联激光器 QCL)必须使用低温冷却。

4.4上变频:电子太赫兹波的产生与分析

自 1933年 成立以来,罗德与施瓦茨公司的核心竞争力一直是为 所有相关电子/微电子领域 开发和制造先进的射频测试和测量设备。

为了支持多种 6G 研究活动,包括半导体行业在 毫米波、太赫兹区域器件、电路特性的研究,罗德与施瓦茨 提供了广泛的开发和分析测量工具。以下各节给出了一些示例 :

使用 变频器 支持高达 1.1THz 频率的矢量网络分析仪。

使用 外部谐波混频器(R&S®FS-Zxx 系列)为信号和频谱分析仪提供扩展频率范围支持,例如 D频段(110GHz ~ 170GHz)和 其他高达 500GHz 的频段 。

使用 倍频器(R&S®SMZ系列)为信号发生器提供扩展频率高达 170GHz 的支持 。

使用 发射和接收转换器,生成和分析 D波段(110GHz ~ 170GHz)的信号。

使用 电波暗室在 D波段(110GHz ~ 170GHz)测量天线辐射性能。

4.4.1 具有计量级精度的基于矢量网络分析仪的太赫兹测量

业界对毫米波和太赫兹范围内进行测量的 矢量网络分析仪(VNA)的需求与日俱增。在 E波段(60GHz ~ 90GHz)除其他应用外,矢量网络分析仪(VNA)可表征晶圆探头系统和波导组件中的有源和无源组件。即使在更高的频率下,网络分析仪在 测试集成电路、传感器和天线、成像系统、射电天文系统和材料 中也有广泛的应用场景。 5G无线通信标准和汽车雷达传感器的生产也为它创造了巨大的测试需求。

几GHz ~ 67GHz 频率的测量是网络分析仪标准的一部分,但毫米波和太赫兹范围的测试要求更高,它们需要外部频率转换器(R&S®ZC1100 示波器可以覆盖高达 1.1THz)。这类扩频器上变频刺激信号,下变频相应信号,以表征在频率下操作的设备在太赫兹范围内。

有源元件的晶圆上表征

为了表征线性和非线性范围内的有源器件,需要在探头尖端定义输入功率。由于无法在晶圆上进行功率校准,因此需要校准波导输出处的功率,并在校准过程中考虑 额外波导、1mm 电缆和探头尖端的损耗。对于功率扫描和压缩点测量, R&S®ZNA 集成的校准程序能够补偿毫米波转换器的非线性,以实现最大的动态测量范围和复现性。通常使用 R&S®ZNA 在较低频率测量有源组件,与高频下使用系统集成的毫米波转换器进行计量级精度测量同样方便。

图11:太赫兹范围内的测量

使用 R&S®ZNA 矢量网络分析仪,在太赫兹范围内使用 毫米波转换器进行测量的配置与在较低频率范围内一样方便(左图)。 MPI TS150-THZ 集成探针系统,R&S®ZNA 配置了显微镜,用于高达 330GHz 的晶圆级测量, GGB Industries Inc. 波导探头直接安装在毫米波 R&S®ZC330 转换器的输出端(右图)。

为了演示系统性能,测量了德国的 弗劳恩霍夫应用固体物理研究所 IAF 的四级 325GHz MMIC 低噪声放大器(LNA)(见 图12)。标量增益 |S21| 以 ±95% 置信区间显示。

4.4.2 D波段宽带信号的产生和分析
可以使用更宽的频率范围来实现最高数据速率,6G 研究的重点频段之一是 D频段(110GHz ~ 170GHz)。图13 展示了支持该频率区域的组件和收发器的测试测量设备。

左图所示为 R&S®FE170ST 发射机(TX)前端,它将 R&S®SMW200A 矢量信号发生器的调制信号(例如 潜在的 6G 波形)上变频到 110GHz ~ 170GHz 的范围。右边是对应的 R&S®FE170SR 接收器(RX)前端,它将信号下变频并将中频(IF)传输到 R&S®FSW 信号和频谱分析仪。解调后的信号表现出优异的 矢量幅度误差(EVM)性能,并强展示出生成信号极低相位噪声。

MMIC 设计

下图展示了由 罗德与施瓦茨公司 及其合作伙伴设计的两个用于测试与测量设备的 MMIC 示例。

所示的 40GHz ~ 70GHz 放大器约为 4mm × 3mm,反映了 罗德与施瓦茨公司 最新 R&S®SMA100B 模拟信号发生器中这种电路的标准尺寸。该仪器在微波范围内提供最高的商用输出功率。

Radiometer Physics GmbH(RPG)也开发了太赫兹源,它组合了 W波段 的大功率放大器 GaAs MMIC 和 基于 GaAs 肖特基二极管 的大功率高频乘法器。图15 展示了在 赫歇尔太空望远镜(左图)上 远红外外差仪(HIFI)的频率可调谐源,频率高达 1100GHz ,覆盖了从远红外到亚毫米波长的光谱范围。右图 展示了欧洲航天局(ESA)JUICE卫星 的 亚毫米波仪器(SWI)的 捷变频率和功率源,最高可达 158GHz 。

4.4.3 D波段 天线辐射性能测量

在 空口(OTA)测试概念发展方面,5G 率先将毫米波频率用于无线通信。这是由于大规模和高度小型化天线阵列不再适用于传导测试。 OTA 天线测试概念可以扩展到 D波段 乃至更高范围,用于探索太赫兹通信和传感。未来的设备将纳入更高集成度的有源天线系统,用于超大规模 MIMO 和 传感应用。在可重构智能表面应用程序(RIS)特性的研究领域,OTA 测试同样重要。

使用 R&S®ATS1000 进行空口测试(OTA)

现在把 6G 研究的重点放在 100GHz 以上的频率,找到大量可用频谱是实现更高数据速率的关键。不仅需要新的宽带高增益天线概念,还需要在天线测量程序方面取得进展。

从传统的 6GHz 以下 蜂窝服务转向 5G 新空口(NR)频率范围2(FR2)已经是一个重大的技术飞跃(图2)。由于路径损耗随频率的平方增加而增加,因此在用户设备和网络基础设施中引入了具有电子波束指向能力的 高增益天线,以确保无线链路的质量。由于集成电路复杂性随频率函数增加而急剧增加,现在大多数开发都针对一种新的波导 D波段(110GHz ~ 170GHz)和 G波段(140GHz ~ 220GHz)。

在接下来的讨论中,我们将考虑一种球面扫描解决方案来测量 D波段 的辐射性能,该解决方案在 R&S®ATS1000 中实现了前所未有的动态范围。该解决方案采用直接 下变频 的新型探头设计,在 170GHz 下提供大于 50dB 的动态范围。

在 110GHz ~ 170GHz 频率范围内测量 被测设备(DUT)的振幅和相位相干响应时,不需要机械修改或额外的射频布线,R&S®ATS1000 简化了测试要求。

被测设备(DUT)是 IMST 新设计的 D波段 透镜的漏波馈电天线(图16)。它可用于 6G 前传 点对多点场景。简化的馈电结构由低介电常数 εr= 2.34 和 直径 35 mm(20λ 170 GHz)的低损耗高密度聚乙烯(HPDE)制成的椭圆透镜组成,该设计具备较高的成本效益。馈源由一个 λ/2 漏波空腔组成,由 WR6 波导激发。可以沿透镜焦平面移动馈源来操纵辐射方向图。

该天线既进行了数值建模,又使用紧凑型系统进行了球面近场扫描天线的实验评估。辐射模式测量是在 R&S®ATS1000 移动球形扫描范围内进行的(图17)。该全电波暗室包括一个分布式轴定位器。

DUT 馈电组件用于相位相干和时间稳定测量。如 图17 中镜头天线下方所示,该倍频链由一个 D波段 亚谐波混频器组成,与探头处使用的混频器相同, D波段 隔离器连接到 被测设备(DUT)的 WR6 分裂块。使用 R&S®ZNA43 4端口矢量网络分析仪(VNA)进行测量,其中前端的一个端口将中频信号馈送到 被测设备(DUT)。

图17 展示了测量探头的概念。 正交换能器(OMT)连接到 20dBi 方形喇叭天线,在整个 D波段 频率范围内,3dB 波束宽度为 16° ,交叉极化隔离为 25dB。当 DUT设置为接收(RX)或发送(TX)时,该组件可以相互工作,并且能够发送或接收两个正交极化场。直接在探头处实现下变频或上变频,从而消除了 RF 频率下的全部电缆损耗。两种极化可以同时测量。

图18 展示了 DUT 全波模拟与测量结果之间的出色一致性。这证实了新探头测量系统具备高精度。无源天线测量可以成功实现近场到远场(NF2FF)变换等相位相干数据据采集。未转换的测量结果显示为红色,表明辐射方向图的主光束已经接近远场渐近行为。

总之,这样一种高效的 D波段 透镜天线设计,在 42% 的带宽下实现增益大于 30dB。通过球面扫描测试系统对该天线进行了精确表征,该系统能够进行稳定的相位相干测量,并在 DUT 输入端和测试探头输出端进行了直接变频。相位相干性是支持精确应用近场到远场转换算法的必要条件,这对于精确确定辐射方向 图零位 和 旁瓣电平 至关重要。

4.5 直接产生太赫兹光子:量子级联激光器(QCL)

4.5.1 带间二极管激光器

光谱与太赫兹频率:带间跃迁与带内跃迁

多年来,在激光中产生相位相干辐射(通过受激辐射进行光放大)一直是一个既定的概念。它已经贡献了许多应用,包括与光纤技术结合的光通信,也是当今互联网的技术基础。激光器由有源介质(可在具有粒子数反转的能级之间发生激光跃迁)、用于反馈腔和额外的频率选择元件组成。

带间二极管激光器

半导体激光二极管是最重要的光电元件之一,它们可以将电流直接转换成相干光。对于光电学来说,直接带隙 III-V族半导体材料 GaAs 和 GaN 最为重要。来自导带的电子(e–)与价带的空穴(e+)复合,发射频率与能级间能量差相对应的光子(图19)。带间二极管激光器价格低廉,能高效的产生从紫外线到可见光到红外频率区域的光子。然而,太赫兹光子的能量比可见光光子小 100 ~ 1000 倍,并且没有材料具有如此小的带隙和粒子数反转。

图19:带间二极管激光器与量子级联激光器(QCL)

在带间二极管激光器中,激发态能级 |e⟩ 和基态 |g⟩ 之间的激光跃迁发生在导带和价带之间,在 量子级联激光器(QCL)中,光子跃迁发生在导带 hv 内设计的 量子阱能级(“波函数工程 ”)之间。

4.5.2 太赫兹 QCL:异质结构设计的子带间激光跃迁

与带间二极管激光器相比,激光发射是在 量子级联激光器(QCL)中 通过使用在周期性堆叠半导体量子阱异质结构中的带间跃迁实现的(“超晶格” 图19)。这个概念最早在 1994年 由贝尔实验室的一个研究小组通过 Jérôme Faist et al 进行了演示。

图20 显示了周期性量子阱异质结构(外延生长的 GaAs 或 InP 结构,厚度为 几纳米)和由此产生的量子阱能级结构。在制造过程中,可以通过控制层深 来设计量子阱深。因此,激光跃迁的波长取决于器件的物理结构(“电子波函数工程”)。这个概念允许产生低能量的太赫兹光子,这是带间二极管激光器无法达到的。

工作原理(图20)
:频率 ν 的光子通过电子从激发态 |e⟩ 到基态 |g⟩ 的子带间跃迁发射,其中 E = hν 是基态和激发态之间的能量差。这个概念的一个优点是:负责发射光子的电子可隧穿到下一个量子阱(有源区),随后发射一个光子。因此,单个电子可以产生多个光子,从而使这一过程变得极其高效。从一个阱到另一个阱的隧穿就是 “量子级联” 这个术语的起源。

图20:QCL:半导体异质结构设计的子带间激光跃迁 “带结构与电子波形工程”,光以电子 “级联” 的形式通过多个量子阱发射,形成 “超晶格”。

作为参考,850nm 的光波长对应的能量差为 1.4 eV。太赫兹频率下成功运行的 量子级联激光器(QCL)在 2002年 首次被证实。从那时起,QCL 在频率覆盖、功率输出和工作温度提高方面取得了迅速发展。通过精心设计量子阱,激光的波长短至 2.75μm(109THz),长至 161μm(1.9THz)。波长较长的器件仍然需要低温冷却,但常温作业最长已达到 16μm。关注点已经 集中在中红外(3.5μm ~ 13μm)和太赫兹光谱(2THz ~ 5THz ≈60μm ~ 150μm)。使用具有腔内非线性混频的长波太赫兹 QCL源 的方法 甚至可以做到低于 1THz 的频率。

实现在室温下工作的太赫兹量子级联激光器的旅程已经向前迈出了一步,最近发表了一种在珀尔帖冷却器范围内 -23°C 的工作设备。

4.6 下变频光子方法:通过光混合从光学到太赫兹

光电频域产生太赫兹:单行载流子光电二极管(UTC-PD)和 作为光合成器 PIN 光电二极管

最近,一种间接产生连续太赫兹波的方法引起了广泛关注:光电二极管可以通过 “光混合” 过程在高带宽光电导体中通过光外差有效地将光信号转换为电信号。它涉及 激光器/红外激光器 在半导体或有机晶体中产生自由电荷载流子。这些载流子被内部或外部电场加速,产生的光电流成为太赫兹波的源。

如 图21 所示,在这种方法中,两个连续波(CW)单模激光器(通常在 1.55μm “光纤通信波长”)的输出,发射频率分别为 ν1 和 ν2,在超快 III–V型 化合物半导体光电探测器(InGaAs/InP)中 “混合” ,在太赫兹区域产生光脉冲频率 νTHz = ν1 – ν2 诱导光电流调制。环绕在光电探测器周围的天线结构将振荡的光电流转换成太赫兹波。最先进的光电合成器基于 GaAs 或 InGaAs/InP,并且要求激光波长低于半导体带隙(即分别约 0.8μm 或 1.5μm)。

光混合技术的优点是,通过调谐激光器,拍频可以在很宽的光谱范围内变化,这直接转化为可广泛调谐的太赫兹辐射。

图21:光混合工艺

在两个稍微失谐的单模激光器拍频 νTHz = ν1 – ν2 处产生太赫兹辐射的光混合过程。从光学频率梳中获得的两个频率可以导出极值频率和相位稳定度。 对于数据传输,其中一个激光器由 马赫-曾德尔调制器(MZM)调制:它由一个干涉仪组成,可将光束被分成两束。在其中一个干涉仪臂中,通过电光调制器(EOM)将激光的相位相对于另一条路径进行偏移,从而在两束光束重组后产生建设性或破坏性调制激光束。拍频信号撞击到光电混合器单行载波光电二极管(UTC-PD)上,集成天线发出太赫兹辐射。

常用两种类型的光电二极管:PIN 光电二极管(PIN-PD)和单行程载流子光电二极管(UTC-PD)。这两种最初都是作为光纤通信网络的检波器开发的,但后来进行了修改以满足太赫兹发射的要求。 UTC-PD 最初由日本 NTT公司 开发,用于 40Gbps 的多级光接收,但这些光电二极管已经增强到能够产生高达 4.5THz 的信号。

在适用于通信应用的频段,如 300GHz 频段,已经实现了毫瓦量级的功率水平。

将激光束的可调谐特性与光混合技术相结合,可以将用于为光通信开发的光矢量场生成技术(例如调制带宽 > 100Gbps 的 马赫-曾德尔调制器)应用到太赫兹范围内,从而使技术进步。此外,如果增加额外的频率,这些技术使得实现多频通信相对容易(图21)。这种组合还可以轻松地将这些无线链路集成到光纤基础设施中。此外,片上通信和未来的高速设备间通信也将需要太赫兹波导。这种波导最近已经利用具有接近零弯曲损耗和零反向散射的拓扑谷光子晶体实现。如 图21 所示,将两个频率引入到相同的频率梳发生器,可以将光学梳独特的相位和频率稳定性以宽带和可调谐的方式传输到太赫兹范围。与 图21 所示的发射机对应的接收机侧,可以是肖特基二极管或与发射器侧对称的设置。这项技术也为测试和测量仪器带来了希望,因为它可以通过光电子技术将频谱分析和矢量网络分析的频率范围扩展到太赫兹区域。

通信用太赫兹波:300GHz 点对点传输

图22 显示了在实验室和室外进行的太赫兹数据传输试验(SISO,即一个发射天线和一个接收天线)。在 200GHz ~ 300GHz 之间有一个低大气损耗的传输窗口(图7)。与自由空间光链路相比,毫米波或太赫兹传输受 雨、雾 等恶劣天气的影响要小得多。图22 的左侧显示了实验室中 100Gbps 的示例,而右侧的照片显示了法国敦刻尔克港中 300GHz 的传输链路,距离为 850米(具有非常聚焦的波束)。

在 图22 的左侧,IEMN 制造的 UTC-PD InGaAs/InP 芯片,以及光电二极管输出与光电流的响应曲线(来源:IEMN UMR CNRS 8520/法国 Lille-Renatech 大学网络实验室)。该光电二极管采用带有亚波长孔径的半透明顶部接触,以增强光电二极管的光学传输和正面照明(1.55μm 波长)。通过晶圆键合在二极管台面下方使用金属镜,进一步提高了器件的响应度。

在 200GHz ~ 300GHz 之间的太赫兹窗口中实现 100Gbps 传输。

4.7 时域产生太赫兹:基于飞秒激光器的光谱学和成像

另一种覆盖大范围频率(0.1THz ~ 6THz)的替代方法涉及光谱学(TDS)和成像的时域(TD)系统。在这种方案中,脉冲太赫兹辐射是通过飞秒激光器产生的。 激光脉冲用分束器分成两部分:一部分到达太赫兹发射机,另一部分到达探测器。超短激光脉冲在发射器(光电导天线)中产生瞬态电流,从而产生在太赫兹范围内具有宽频谱的电磁波包。

太赫兹脉冲与光谱样本相互作用并到达接收器,接收器以 “Pump-Probe” 的方式工作:入射太赫兹脉冲改变材料的某些特性(例如电导率或双折射),分离的激光脉冲探测这种效应。可变延迟用短得多的 “探头” 脉冲扫描太赫兹波包。然后太赫兹幅度进行傅里叶变换再现频谱。

时域光谱学的优点是光谱范围非常大,测量速度快。商用系统产生的光谱高达 6THz。太赫兹时域系统用于各种工业应用,例如质量保证中的无损检测,特别是聚合物和陶瓷等合成材料。在太赫兹测量中,可以推导出复杂的折射率(介电常数)和几何结构。例如通过到达时间来测量厚度,在纸张生产中,将宽光谱转化为微米厚度分辨率。

图23 显示了由时域光谱仪(TeraFlash pro, TOPTICA Photonics AG)记录的公交卡的太赫兹图像,该样品的探测频率从 100GHz ~ 6THz。

图23:一张日本预付公共交通卡的照片(左图)和处理过的太赫兹图像(右图),揭示了底层电子设备的内部视图(由 TOPTICA Photonics AG 提供)

第五章 毫米波和太赫兹电子的半导体技术

当今社会迫切需要更高速率的无线连接、更高分辨率的雷达成像系统,这会推动微波系统工作频率的不断增加。虽然 5G 已经为 毫米波频率应用在无线网络奠定了基础,但 6G 以及卫星通信的研究仍在进一步推动毫米波系统的发展,使其达到 100GHz 以上的范围。

这一趋势为半导体行业在极高频率下提供高输出功率的组件带来了越来越大的挑战。功率放大器通常以单片微波集成电路(MMIC)来实现,是无线通信和成像系统中最重要的组件之一。它们在输出功率、效率、带宽、线性度和噪声等方面对整个系统的性能有着决定性的影响。

在这里,我们重点介绍了高频应用相关半导体材料的一些关键特性,以及最先进的功率放大器发展现状。

5.1 高频应用半导体的材料特性

高频高功率:III-V族半导体(GaAs,GaN,InP)与 锗化硅(SiGe)

直接带隙的 III-V族半导体 是光电子(激光)和高频应用的理想材料,硅技术具有最先进的大规模制造工艺,可为商业应用提供经济高效的解决方案。

下面的雷达图对不同的高速半导体材料特性进行了总结和比较(图24)。

我们提供以下关键参数的简要说明:

电子迁移率

单位电场强度下所产生的载流子平均漂移速度被称为迁移率。由于电子比带正电的空穴表现出更高的迁移率,所以高速半导体器件都是基于电子转移电流的。关于 “电子迁移率” 这个参数的单位是 [ m² / (Vs) ]。

饱和速度

该参数描述了当电荷被高电子场强度驱动时,半导体器件中电子的最大速度。该参数的单位简单来说就是速度单位 [m/s]。在高场强下运行的器件的运行状态也称为 “速度饱和”。

击穿场强

该参数描述了材料在变得导电之前承受高电压的能力(在没有电流限制的情况下,这通常对器件具有破坏性),单位为 [V/m]。这个参数定义了器件的最大工作电压。有一些技术,如场板的应用,可以改善和均衡半导体器件中的场强分布,以提高其击穿电压。

能隙

能隙或带隙以 [eV] 为测量单位,基于量子物理学的特性,描述了在无杂质半导体中没有能态可用的传导带和价带之间的能差。对于异质结器件,通过在半导体合金中添加额外的材料来形成带隙结构,以提高器件性能(例如 SiGe HBTs 或 基于 III-V 的 HEMT 器件)。

热导率

该参数描述了衬底材料传导热能的能力,单位为 [ W / (mK) ] 。特别是对于功率放大器等功率应用,由于这些器件输出功率经常受到热限制,所以这是一个必不可少的参数。由于热限制,氮化镓 HEMT 需在远低于击穿电压的情况下工作。特别注意,因为这个问题,导致高端氮化镓 GaN 器件是在具有高导热性的晶格匹配衬底上制造的,例如 SiC 甚至 金刚石。

在给定的半导体材料中,上述参数强烈影响其应用领域。

砷化镓(GaAs)

根据掺杂浓度的不同,砷化镓 具有相对较高的电子迁移率和饱和速度(图24),因此,可以实现极高的频率。虽然材料成本昂贵,但发展历史悠久,工业界积累了大量的经验。

目前,砷化镓技术可用于肖特基二极管、伪晶高电子迁移率晶体管(pHEMT)和异质结双极晶体管(HBT)。砷化镓 pHEMT 技术在高频段具有良好的宽带噪声。 HBT 特别适用于低 1/f 噪声和高击穿电压的情况。砷化镓肖特基二极管可用于生产高达 4.7THz 的极低噪声接收器。它还可以用于高达几个太赫兹的高效率倍频,使其成为一种非常通用的毫米波技术。

砷化镓混频器和倍频器既可以作为 MMIC 集成到模块中,也可以将倒装芯片转移到主机基板上,以改善介电负载、散热。

磷化铟(InP)

磷化铟(InP)具有最高的电子迁移率、饱和速度。因此,可以实现极高的频率。然而,材料成本高,晶圆/芯片 处理困难。

磷化铟(InP)技术的使用场景主要有 异质结双极晶体管(HBT)和 高电子迁移率晶体管(HEMT)。双极型晶体管通常用于最先进的锗化硅 HBT 速度 和/或 击穿不足的模拟集成电路。InP HEMTs 的应用领域超过 400GHz,主要用于频率高达 700GHz 的超低噪声放大器。

从应用的角度来看,铟砷化镓(InGaAs)变形异质 HEMT(mHEMT)技术与 InP HEMT 技术相当,只是它们使用砷化镓衬底。

氮化镓(GaN)

当氮化镓被证明能够实现 蓝色LED(InGaN)以及随后的蓝色激光器后,它受到了相当大的关注。这产生了 2014年 的诺贝尔物理学奖。氮化镓还为高功率应用提供了某些有利的材料特性,即高能隙,高击穿场强,并且与 碳化硅(SiC)衬底结合,具有良好的导热性,用于散热。这允许氮化镓晶体管在高偏置电压下工作,从而提供高输出功率。由于缺乏成熟的块状氮化镓源材料和氮化镓的导热性不足,导致需要在 碳化硅(SiC)、硅(Si)以及最近的金刚石等载体衬底上生长氮化镓异质结构。SiC 因其优异的导热性、与氮化镓的低晶格失配性能优异 而成为大功率、高频应用的主流衬底材料。硅基氮化镓(GaN-on-Si)是一种更具成本效益的解决方案,对于与 CMOS 的单片集成非常有意义。与 碳化硅(SiC)相比,硅(Si)衬底具有更高的介电损耗,这对毫米波 MMIC 产生了显著的影响。另外,室温下的导热系数也不同,碳化硅(SiC)的性能提高了三倍(400 W / (m ∙ K) 对比 130 W / (m ∙ K))。由于 氮化镓(GaN) HEMT 晶体管的安全工作区域受到热边界条件的限制,为了实现高输出功率和合理的平均故障时间 (MTTF),衬底的导热性至关重要。

由于效率优势和在更高通道温度下工作的可行性,氮化镓(GaN)几乎完全取代了硅基 LDMOS 技术,广泛用于低于 10GHz 的基站。最近,氮化镓(GaN)也被用于微波回程应用。

上述氮化镓(GaN)的高带隙,外加最高通道温度高达 +200°C ,使该技术成为恶劣环境的绝佳选择。特别是星载应用,因为受益于该技术的辐射硬度,所以该技术具有高带隙和在巨大温度范围(“昼夜”)下工作的能力。与其他半导体技术相比,氮化镓(GaN)放大器系统具有非常低的质量输出功率和体积输出功率比。

锗化硅(SiGe)HBT 和 互补金属氧化物半导体(CMOS)

锗化硅(SiGe)异质结双极晶体管(HBT)也提供了相当好的电子迁移率,允许它们用于高速模拟应用。如果与互补金属氧化物半导体(CMOS)技术相结合,可以充分利用该技术的优势,以中等成本实现包含高速模拟和数字功能的混合信号专用集成电路(ASIC)。 CMOS 和 SiGe HBT 的结合通常被称为 “BiCMOS” 工艺。利用成熟的 CMOS 制造工艺,并将高频元件与 模拟/数字 信号处理电路集成在同一芯片上,实现了前所未有的集成度和灵活性。

SiGe HBT 本身是一种广泛用于汽车雷达应用或短程通信的材料。该技术的击穿电压足以提供必要的输出功率。最近,人们也对这种材料用于微波回程产生了兴趣,在 高体积、高集成密度 下获得更低的每片生产成本。

异构集成作为 6G 研究课题

与毫米波应用相关的不仅有一种半导体技术,6G 最近的研究领域是各种半导体技术的异质集成,以优化性能和能耗,例如 InP(速度)、CMOS(集成密度)和 GaN(输出功率)组合。

表2:半导体材料特性和应用

5.2 最新毫米波功率放大器概述

5G 和 6G 的应用正在突破频率的界限。相关的数据点 “扎堆” 围绕着驱动应用场景。基于文献的数据,最新毫米波放大器的概述如 图25 所示。每个数据点代表了多年来发表于论文的测量值。左图 包括截至 2016年 的测量值,而 右图 图表总结了截至 2020年 的工作情况。

图25:截至 2016年9月(左)和 2020年10月(右)的最先进高频功率放大器概述

很明显,不同的半导体技术以不同的颜色表示的数据点在频率范围内不是均匀分布的,而是聚集在某些频带周围。这显然是应用围绕某些频率分配导致的。例如,在 28GHz 附近发表有大批成果,这些成果与 5G 新空口(NR)毫米波频段的基础设施和终端电路有关,如:n258(24GHz ~ 28GHz)、 n257(26GHz ~ 30GHz)和 n260(37GHz ~ 40GHz)。另一组结果集中在 60GHz 左右,用于 无线千兆网(WiGig),其中大量基于 CMOS 的电路。

70GHz ~ 95GHz 之间的数据点聚集各种应用。 77GHz 用于汽车雷达,而一些成像雷达系统在 94GHz 左右。此外,这里也可以找到 E波段 回程和点对点高速率通信链路的示例。

值得注意的是,在 2016年 之前,100GHz 以上只有少数成果发表。然而,近年来在基于 InP 的设计,以及在较小程度上基于 SiGe 和 InGaAs mHEMT 系统的设计,使得更高的毫米波波段取得了巨大的进展。这背后驱动的力量显然是下一代通信技术 —— 6G。

功率放大器的频谱包络甚至已经超过 300GHz,尽管功率水平较低:500GHz 功率为几毫瓦(mW),1THz 功率为亚毫瓦(sub-mW)。

第六章 100GHz 以上的信道传播测量

6.1 从信道探测到信道模型

毫米波和太赫兹频率传播特性作为新物理层的基础
只有在对尚未充分研究的频率范围内的电磁波传播特性有深入了解的基础上,才能开发 6G 所设想的亚太赫兹通信。

本章解释了时域信道探测的概念,并介绍了在具有代表性的室外和室内场景,在 300GHz 左右的 H/J波段 和 D波段(110GHz ~ 170GHz)的信道测量结果。这项研究目的是更好地了解毫米波和亚毫米波(亚太赫兹和太赫兹)无线信道,以及目前在 ITU-R WP5D 中讨论的 “100GHz 以上频段 IMT 的技术可行性”。

信道模型作为利用新频率范围的基础

在开发新的通信标准之前,必须理解并表征指定频段内的传播特性,然后导出信道模型,以实现新标准的系统级仿真。物理层参数包括导频信号在时频域中的分布,这使得接收机能够均衡并补偿信道对传输信号的影响。开发、验证、编码、纠错 需要考虑这种特性。

基础测量数据必须能准确无误复现所调查的环境特征。基于几何学的随机信道模型(GSCM),例如 3GPP TR 38.901 有效频率高达 100GHz,是基于不同环境场景下的大量信道测量。

4G 及之前的 3GPP 信道模型开发和规范仅限于 6GHz 以下的频率范围和准静态环境。随着 5G 的发展,频率范围扩展到毫米波区域,应用于 汽车、高速列车、工业环境等新用例对应的动态场景和其他类型的环境场景。然而,由此产生的信道模型并不能简单地扩展到 6G 预期的 100GHz 以上的范围。它们必须经过验证和微调,以正确反映环境的影响。与毫米波范围相比,在这个频率范围内的传播受到人体、车辆和降雨等环境条件的强烈影响。

从信道测深到信道模型

“信道测深” 一词来自声纳技术,即从舰船或潜艇发出短声脉冲,并将反射记录在时域中,这就提供了周围环境的可行图像。通过信道探测进行的信道测量提供了电磁波在特定频率下传播特性的图像。声纳的发射器和接收器都集成在相同位置,电磁波信道测深时的发射机和接收机是分开的。在时域信道探测中,具有良好自相关特性的调制脉冲信号,如 Frank-Zadoff-Chu (FZC) 序列,可作为 “ping”,记录为 信道脉冲响应(CIR)。这种传播时间测量与 GPS卫星 的接收机中执行的时间延迟测量非常相似(参照 GPS定位卫星,推断位置信息),其中每颗卫星传输其单独的序列。信道脉冲响应(CIR)包括环境中物体的直接传播分量(视距 LOS)、所有反射和散射分量(非视距 NLOS)、通道模型参数及其值可以从结果中推导和确定。

图26:时域信道测深工作原理:通道脉冲响应(CIR)是通过在感兴趣的频率发射电磁 “ping”并捕获所有返回信号分量来测量的。

通常,只有当物体至少与入射波的波长一样大时,它们才会对电磁波 “物理可见”,并充当反射器或散射器。这意味着在更高的频率 如 30GHz 的尺寸在厘米范围内的物体上已经起到反射器的作用。

合作研究

罗德与施瓦茨公司 在信道探测项目方面拥有多年的经验,包括在日本东京的街道峡谷中进行的 67GHz 高分辨率信道测量活动。2019年 3GPP 研究计划的重点是在生产环境等工业场景中开发新的 5G 信道模型。为了支持 3GPP 的工作,罗德与施瓦茨公司 与 弗劳恩霍夫·海因里希·赫兹研究所(HHI)合作,不仅在其 Memmingen 和 Teisnach 工厂进行了 28GHz 和 66GHz 毫米波频段的测量,还在 3.7GHz ~ 3.8GHz 频段进行了测量,该频段指定用于德国的专用校园网。

6.2 300GHz 时域信道探测

6G 重点放在更高频率的信道上。在弗劳恩霍夫HHI和弗劳恩霍夫应用固态物理研究所(IAF)的合作努力下,开发了一种在 275GHz ~ 325GHz 范围内产生并分析信号的设备,带宽为 2GHz 。该信号可用于信道测量,也可以用于新型波形调制或传输实验,图27 和 图28 显示了测试方案。室温下极低噪声和宽带应用的 InGaAs mHEMT MMIC 是 IAF 的关键技术之一(见第 5.1章)。

发射机和接收机之间传播延迟的测量

如 图27 所示,测量结果使用基于时域信道的探测仪捕获。在发射端(TX),R&S®SMW200A 宽带矢量信号发生器 在中频(IF)下产生带宽为 2GHz 的数字基带 “ping序列”。 单边带上变频器(结合来自弗劳恩霍夫IAF的太赫兹收发器)将中频信号提高到所需的发射频率,由 R&S®SGS100A 作为本地振荡器(LO)源。在接收端(RX)天线信号被放大,并通过 下变频器 和 LO发生器 混合到中频域(IF domain)。 中频域(IF domain)信号由 R&S®FSW 信号和频谱分析仪采样,I/Q采样 被存储以供进一步处理。 发射机 和 接收机 与两个基于 铷rú 的基准时钟触发单元同步(Synchronomat)实现相干测量,并允许相位评估和相干平均,以及确定绝对飞行时间。

该测试系统在 300GHz 频率下的初始测量结果表明,其动态范围很宽,在该频率范围内是无与伦比的。为了系统地表征亚太赫兹频率范围,以下各节讨论弗劳恩霍夫HHI在各种环境情景中进行的联合测量。

图27:300GHz 信道测深系统线框图

图28:300GHz 室内环境的信道脉冲响应(CIR)

使用 R&S®SMW200A 矢量信号发生器、R&S®SGS100A 信号发生器 和 R&S®FSW43 信号和频谱分析仪进行 300GHz 信道测量的测试。图片顶部显示了一个集成喇叭天线的收发器。该装置可用于信道探测以进行信道表征,也可用于新波形的传输实验(左图)。右图是 300GHz 的室内环境中多重反射的信道脉冲响应(CIR)。发射机和接收机之间的距离约为 4米。非常狭小的室内环境具有一些反射特征。电磁波在 1ns 内传播约 30cm。

6.3 罗德与施瓦茨公司慕尼黑总部的太赫兹通道测量

弗劳恩霍夫·海因里希·赫兹研究所(HHI)做了上述 300GHz 通道探测系统的表征。

最近,在慕尼黑的罗德与施瓦茨公司总部 对亚太赫兹频率(158GHz ~ 300GHz)信道的传播特性进行了更系统的研究。频率的选择参照未来的 6G 网络讨论。该研究侧重于两个代表性场景:两个研发大楼之间走廊的街道峡谷式( 城市微蜂窝 UMi )户外场景,以及 类似于购物中心或机场的中庭室内活动的测量。

与 300GHz(图27)相似,图29 展示了 158GHz 相关信道测深仪的线框图。使用时域信道测深仪后,测量消耗时间变短,可以在多个位置执行多次测量,完成覆盖 360° 的空间角度。

图29:158GHz 通道测深测量线框图

在发射机(TX),该设备包括 单边带上变频器 和 放大器 连接到具有 7dBi 增益的开放波导。 R&S®SMW200A 矢量信号发生器在 14GHz 中频(IF)处提供一个预先计算的中频探测序列。使用 Frank-Zadoff-Chu 测深序列长度为 100μs,带宽为 B = 2 GHz(相应的时间分辨率 τ = 1/B = 0.5ns)。

接收机(RX)由 R&S®FSW43 信号 和 频谱分析仪 以及由 12.24GHz 频率的 LO 发生器馈电的下变频器组成。水平极化E平面喇叭天线,天线增益为 20dBi ,方位角约为 15° 作为接收天线。 D波段 前端将接收到的信号下变频为 11.12GHz 的中频(IF)。信号分析仪对频率为 2.5GHz 的中频(IF)信号进行采样,其中一次测量涵盖序列的 250个 周期。接收天线和下变频器安装在精密旋转台上,以允许相对于方位角进行角度分辨测量。接收机安装在摄像小车上,方便精确地移动到不同的接收机位置(图31)。由于所用天线的波束宽度约为 15°,无线电信道在接收机的方位角域中以 15° 的步长采样。

为确保发射器和接收器之间的相干采样,所有仪器都连接到一个时间基准(弗劳恩霍夫HHI同步器)。除了来自高精度 铷rú原子钟的 10MHz 参考信号外,同步器还可以在发射机和接收机上实现同步和相干触发。

测量完成后,将接收到的 I/Q 时域样本作为原始测量数据从信号分析仪传输到计算机。数据的后处理包括重新采样和滤波,评估每个序列周期的公共相位漂移和补偿相位漂移,所有序列周期的相干平均,使用背靠背校准测量数据对振幅和相位校正进行关联和应用。结果返回 通用校准信道脉冲响应(CIR),以奈奎斯特速率采样,其幅度对应通信信道(包括天线)的增益,延迟对应飞行时间。

表3:158GHz 和 300GHz 下的信道探测参数

表3 总结了时域信道测深仪的基本技术参数。使用理想的复杂相关序列( Frank-Zadoff-Chu 序列 )的配置,并评估和补偿相位噪声引起的漂移后进行额外相干平均,可以实现较大的处理增益和非常宽广的动态范围。

下一节描述了一些初步结果,更详细的定量分析正在准备中。

6.4 测量场景和结果

在德国慕尼黑的罗德与施瓦茨公司总部进行了测量,它们代表了 城市微街道峡谷场景 和 室内购物中心/机场场景(图30)。室外测量是在左边两座灰色阴影建筑之间进行的,街道的宽度为 15.5米,周围建筑的高度约为 20米。

6.4.1 室外街道峡谷场景(城市微蜂窝 UMi)

第一个测量场景位于两个研发大楼之间的走廊中,类似于街道峡谷场景( 城市微蜂窝 UMi 如 图30 和 图31 所示 )。固定发射机(TX)放置在走廊尽头的自行停放架上(图30 左侧红星处)1.5米 的高度。 在那里有一个更开放的空间,有一个小广场和孤立的树木(图31)。包括测试与测量设备在内的接收机(RX)安装在 1.5米 高的无线平台(摄像小车)上,放置在离发射机不同距离的测量位置,最大距离为 170米(图32)。大多数测量都是在视线范围内(LOS)下进行的。

图31 中的测量示例显示了 158GHz 和 300GHz 时距离为 30米 的对准天线的 信道脉冲响应(CIR)。LOS路径下,30米距离的第一个延迟(飞行时间)为 0.1μs 。 多径分量在 158GHz 下也很明显,并且比在 300GHz 下更明显。

图31:室外 158GHz 和 300GHz(D波段)下的角度分辨 信道脉冲响应(CIR)太赫兹信道测量,在慕尼黑 Rohde&Schwarz 总部的街道峡谷环境

左图 展示了街道峡谷尽头的 发射器(TX)视角(另见 图30)。右图展示 接收器(RX)安装在无线平台(相机推车)的装置,用于在不同位置进行测量。测量示例如下所示,在距离发射机 30米 处的信道脉冲响应为 158GHz(左图)和 在相同位置的 300GHz(右图)。 1μs 的延迟对应于 300米 的距离。

图32 展示了在 158GHz 的室外场景中,在 10米 ~ 170米 的不同距离上的瞬时 CIRs 组合成一个图。这些测量覆盖了两座建筑物之间的完整街道长度,天线始终是对齐的。从这组大规模测量中,可以推导出路径损耗指数。在延迟较大的多径分量几乎存在于整个测量计划中。

图32:大规模户外街道峡谷场景测量

该图显示了158GHz 的 CIRs,在 10米 ~ 170米 距离内,天线排列整齐。

角分辨 Angle-resolved 测量

对测量数据集的进一步评估涉及对角度信息的分析。在每个测量点,将接收机旋转到 24个 等距的角度位置,从而在方位角平面上以 15° 角对无线电信道进行空间扫描。

图33 显示了在同一测量点(室外 30米)对两个频率( 158GHz 和 300GHz )的路径评估结果。角轴表示循环维度,意味着这些图中的第一行和最后一行是相同的,这也反映在颜色上。针对这些评估,为了从噪音中清晰地区分信号路径,需要适当地控制噪声阈值。对于 图33 中给出的示例,将 158GHz 绝对噪声阈值被设置为 -120dB , 300GHz 时设置为 -118dB 。

图33:158GHz(上图)和 300GHz(下图)在 30米距离处(室外)延迟角域的评估路径

基于此路径估计,可以将所有路径的总接收功率(即有效总路径增益)求和,图中也显示了这一点。虽然 300GHz 的信道比 158GHz 的信道稀疏得多,但我们可以清楚地看到,总体功率没有太大的差异。与 158GHz 相比,我们预计 300GHz 的总功率将减少 6dB 左右。但事实并非如此,因此我们可以得出结论,由于测量原理的高灵敏度,可以解决 158GHz 的附加路径,但它们对总功率没有显著贡献。均方根(Root Mean Square,RMS)延迟扩展 和 均方根(Root Mean Square,RMS)角扩展 等统计参数如也可以从这些结果中进行评估。

6.4.2 研发大楼中庭的室内购物中心/机场场景

室内测量是在 图30 右侧 和 图34 所示楼内的一个大型开放空间进行的,类似于 购物中心/机场场景。大厅的空间大约是 52米 × 13米,天花板高度约为 20米。发射天线(TX)部署在大楼门口电梯前方的固定位置,高 1.5米。接收器(RX)安装在高度 1.5米 的无线平台上,并移动到可以覆盖整个建筑面积的矩形网格上的不同位置。

图34:室内中庭场景(商场/机场)的照片,接收器(RX)位于前面的旋转台上,发射机(TX)位于后面电梯处(另见 图30)

图35 展示了在一个特定位置(矩形网格中)具有 LOS峰值 和 多个多径分量 的角度分辨估计路径。这是一个室内测量的例子,频率为 158GHz,距离为 40米。 正如预期的那样,与室外测量相比,来自不同方向的更多 多径分量有助于提高总体接收功率(40米 时为 -71.4dB,30米 时为 -75.1dB)。

可以通过玫瑰图来呈现 图35(下),每块 “饼” 代表各自角仓的总功率,将所有的 “饼” 进行处理,便可归一化为总功率。一个角仓内不同路径的单一贡献用圆点表示。我们可以清楚地看到,只有一个或两个角仓占了几乎所有的总功率,而在一个仓中,只有少数路径有显著贡献。

虽然大部分功率来自视距(LOS)方向,但重要的多径测量覆盖了所有的方位角方向。

图35:中庭场景(购物中心/机场)在 158GHz 下某个特定室内位置的路径评估,角度范围覆盖 -180° 至 180°

在底部的玫瑰图中,相同的数据集显示在极坐标图中,其中每个圆点对应一个峰值,三角形(“饼”)代表各自角度仓中的整体功率。可以观察到多个多径分量。

第七章 结论

太赫兹技术和应用只是未来 6G 无线通信的一个潜在组成部分。该技术有望成为不可或缺的 —— 不仅要在 Tbit/s 级别上实现最大吞吐量以及极低延迟的目标,而且还会迸发出新的使用场景。设想的 6G 场景涵盖了 通信、光谱、成像和感知等众多领域。然而 6G 的商业实施依托于尚未开发的可行商业模式。

在 2030年 左右推出 6G 网络之后,太赫兹技术可能需要一些时间才能实现大规模商业化。尽管如此,已经启动的研究活动刺激了射频电子高频半导体技术的创新,以及相关前景新设备的快速发展。

虽然半导体技术继续向极高频率发展,但毫米波带来的技术挑战是有目共睹的,它们涉及效率和功耗。与毫米波相比,由于无线电波传播的范围更短,太赫兹频谱区域的挑战只会加剧,可以通过波束成形的方式聚焦信号来缓解,这涉及到在小空间中容纳更多数量的天线以产生精确的波束。虽然室外和室内太赫兹应用都是可行的,但室内很可能成为太赫兹应用的主要场景。

利用光子技术产生太赫兹波是一种替代技术的发展分支,具有将现有光电器件的功率效率转移到太赫兹频率区域的潜力。将当今的实验室设备小型化到光子集成电路(PIC)中可能成为主流解决方案。哪一种技术最终会成为主流,哪一种方法将用于何种特定场景,这将是一件令人期待的事情。

目前 6G 技术试验和可行性研究的下一个里程碑是 2023年 的世界无线电大会(WRC)。虽然 2023年 不会做出关于 6G 频谱的决定,但 WRC23 将为 2027年 的下一届 WRC 制定议程,届时 6G 标准化工作将全面展开。这就是为什么工业界和学术界的研究活动都努力在 2023年 之前,掌握太赫兹通信在技术上和使用场景上都可行的证据。这包括上一章所述的太赫兹信道测量活动,以了解传播特性,并为这一新的通信频率区域开发信道模型,以及各种公司和研究机构已经证明的太赫兹无线电链路。

自数字无线通信时代开始以来,罗德与施瓦茨 一直是工业界和学术界的密切合作伙伴和领先的测试和测量供应商。现如今该公司为 6G 研究项目提供解决方案和专业知识,包括太赫兹研究,并为下一个无线通信标准的商业化铺平道路。

第八章 参考文献

[1] "5G Evolution and 6G," NTT DOCOMO, Inc., White Paper, January 2022 (Version 4.0).

[2] "Key drivers and research challenges for 6G ubiquitous wireless intelligence," 6G flagship research program,University of Oulu, Finland, 2019.

[3] Samsung, "6G The Next Hyper-Connected Experience for All," White Paper, 2021.

[4] The 5G Infrastructure Association, "European Vision for the 6G Network Ecosystem," White Paper, 2021.

[5] Nokia Bell Labs, "Communications in the 6G Era," White Paper, 2021.

[6] 6G Flagship, University of Oulu, "White Paper on RF Enabling 6G - Opportunities and Challenges from Technology to Spectrum," 6G Research Visions, No. 13, April 2021.

[7] MediaTek Inc., "6G Vision Whitepaper," January 2022.

[8] IMT-2030 (6G) Promotion Group, "6G Vision and Candidate Technologies," CAICT, MIIT, China, June 2021.

[9] National Institute of Information and Communications Technology (NICT), "Beyond 5G/6G White Paper," Tokyo, August 2021.

[10] KDDI Research, Inc., "Beyond 5G/6G White Paper ver.2.0.1," October 2021.

[11] Innovative Optical Wireless Network Global Forum (IOWN GF), "IOWN GF System and Technology Outlook," 2021.

[12] 5G Americas, "Mobile Communications towards 2030 (White Paper)," November 2021.

[13] H. Chun, A. Gomez, C. Quintana et al., "A Wide-Area Coverage 35 Gb/s Visible Light Communications Link for Indoor Wireless Applications," Nature Scientific Reports, vol. 9, p. 4952, 2019.

[14] Juan Yin et al., "Satellite-based entanglement distribution over 1200 kilometers," Science, vol. 356, no. 6343, pp. 1140 to 1144, 2017.

[15] National Institute of Information and Communications Technology (NICT), "Quantum Network White Paper," Tokyo, August 2021.

[16] ETSI, "Industry Specification Group (ISG) on Reconfigurable Intelligent Surfaces (RIS)," October 2021. [Online]. Available: https://www.etsi.org/committee/ris.

[17] V. Joshi, M. Le Gallo, S. Haefeli et al., "Accurate deep neural network inference using computational phasechange memory," Nature Communications, vol. 11, p. 2473, 2020.

[18] A. Sebastian, M. Le Gallo et al., "Memory devices and applications for in-memory computing," Nature Nanotechnology, vol. 15, pp. 529 to 544, 2020.

[19] F.-L. Luo, Machine Learning for Future Wireless Communications, Wiley-IEEE Press, 2020.

[20] ETSI White Paper #34, "Artificial Intelligence and future directions for ETSI," ETSI, June 2020.

[21] C. E. Shannon, "A Mathematical Theory of Communication," The Bell System Technical Journal, vol. 27, pp. 379 to 423, 623 to 656, 1948.

[22] ITU Radiocommunication (ITU-R), "Radio Regulations, Articles, Edition of 2020," ITU, 2020.

[23] ITU, "World Radiocommunication Conference 2019 (WRC19) Final Acts," Oct-Nov 2019.

[24] "IEEE 802.15 WPAN™ Terahertz Interest Group (IGthz)," [Online]. Available: https://grouper.ieee.org/groups/802/15/pub/SCTHz.html.

[25] M. Naftaly, N. Vieweg and A. Deninger, "Industrial Applications of Terahertz Sensing: State of Play," Sensors, vol. 19, p. 4203, 2019.

[26] VDI / VDE, "Terahertzsysteme und Anwendungsfelder, VDI-Statusreport," VDI / VDE-Gesellschaft Mess- und Automatisierungstechnik, March 2020.

[27] R. W. Wilson, K. B. Jefferts and A. A. Penzias, "Carbon Monoxide in the Orion Nebula," Astrophysical Journal, vol. 161, pp. L43 to L44, July 1970.

[28] B. Thomas et al., "The Ice Cloud Imager Front End Receivers onboard MetOp-SG satellite – Preliminary Design and Results," in 28th International Symposium on Space Terahertz Technology (ISSTT 2017), Cologne, Germany, 2017.

[29] J. A. Francis, "Vapor Storms," Scientific American, vol. 325, no. 5, pp. 26 to 33, November 2021.

[30] B. Thomas et al., "Digitally tunable 150 GHz Local Oscillator chain for the Submillimeter Wave Instrument onboard the ESA JUICE mission," in Proceedings of the 30th International Symposium on Space Terahertz Technology (ISSTT2019), Gothenburg, Sweden, 2019.

[31] Ericsson, "Microwave backhaul beyond 100 GHz," Ericsson Technology Review, February 2017.

[32] A. S. Hamza, J. S. Deogun and D. R. Alexander, "Wireless Communication in Data Centers: A Survey," IEEE Communications Surveys & Tutorials, vol. 18, no. 3, pp. 1572 to 1595, 2016.

[33] The Event Horizon Telescope Collaboration et al., "First M87 Event Horizon Telescope Results. IV. Imaging the Central Supermassive Black Hole," The Astrophysical Journal Letters, vol. 875, no. 1, 2019.

[34] M. Tonouchi, "Cutting-edge terahertz technology," Nature Photonics, vol. 1, p. 97 to 105, February 2007.

[35] A. Rumiantsev, T. Naing Swe and A. Henkel, "Achieving Metrology-Level Accuracy When Making THz Measurements," in The Latest in mmWave and THz Test and Measurement Technology, https://www.microwavejournal.com/articles/27082, Microwave Journal, December 2021.

[36] Th. de Graauw et al., "The Herschel-Heterodyne Instrument for the Far-Infrared (HIFI)," Astronomy and Astrophysics, vol. 518, p. id. L6, July 2010.

[37] R. Stuhlfauth and H. Mellein, "Over-the-air RF conformance measurements on 5G NR devices," Rohde & Schwarz white paper, 2021.

[38] B. Derat, S. Schmitz, S. Lachner, M. A. Campo and S. Bruni, "Numerical Modeling and Experimental Validation of a D-band Lens-Based Antenna Design for Beyond 5G Communications," 2020 Antenna Measurement Techniques Association Symposium (AMTA), pp. 1 to 5, 2020.

[39] J. Faist, F. Capasso, D. L. Sivco, C. Sirtori, A. L. Hutchinson and A. Y. Cho, "Quantum Cascade Laser," Science, vol. 264, no. 5158, pp. 553 to 556, 1994.

[40] R. Köhler, A. Tredicucci and F. Beltram et al., "Terahertz semiconductor-heterostructure laser," Nature, vol. 417, pp. 156 to 159, 2002.

[41] K. Fujita et al., "Sub-terahertz and terahertz generation in long-wavelength quantum cascade lasers," Nanophotonics, vol. 8, no. 12, pp. 2235 to 2241, 2019.

[42] A. Khalatpour, A. K. Paulsen, C. Deimert et al., "High-power portable terahertz laser systems," Nature Photonics, vol. 15, pp. 16 to 20, 2021.

[43] T. Nagatsuma, G. Ducournau and C. Renaud, "Advances in terahertz communications accelerated by photonics," Nature Photonics, vol. 10, pp. 371 to 379, 2016.

[44] L. Liebermeister, S. Nellen, B. Globisch et al., "Optoelectronic frequency-modulated continuous-wave terahertz spectroscopy with 4 THz bandwidth," Nature Communications, vol. 12, p. 1071, 2021.

[45] S. Nellen, T. Ishibashi, A. Deninger et al., "Experimental Comparison of UTC- and PIN-Photodiodes for Continuous-Wave Terahertz Generation," Journal of Infrared, Millimeter, and Terahertz Waves, vol. 41, pp. 343 to 354, 2020.

[46] T. Ishibashi, Y. Muramoto, T. Yoshimatsu and H. Ito, "Unitraveling-Carrier Photodiodes for Terahertz Applications," IEEE Journal of Selected Topics in Quantum Electronics, vol. 20, no. 6, pp. 79 to 88, 2014.

[47] T. Ishibashi and H. Ito, "Uni-Traveling Carrier Photodiodes: Development and Prospects," IEEE Journal of Selected Topics in Quantum Electronics, vol. 28, no. 2, pp. 1 to 6, March-April 2022.

[48] H. Song, K. Ajito, Y. Muramoto, A. Wakatsuki, T. Nagatsuma and N. Kukutsu, "Uni-Travelling-Carrier Photodiode Module Generating 300 GHz Power Greater Than 1 mW," IEEE Microwave and Wireless Components Letters, vol. 22, no. 7, pp. 363 to 365, July 2012.

[49] P. Latzel et al., "Generation of mW Level in the 300-GHz Band Using Resonant-Cavity-Enhanced Unitraveling Carrier Photodiodes," IEEE Transactions on Terahertz Science and Technology, vol. 7, no. 6, pp. 800 to 807, Nov. 2017.

[50] J. Webber et al., "Terahertz Band Communications With Topological Valley Photonic Crystal Waveguide," Journal of Lightwave Technology, vol. 39, no. 24, pp. 7609 to 7620, December 2021.

[51] R. Gotti, T. A. Puppe, Y. Mayzlin et al., "Comb-locked frequency-swept synthesizer for high precision broadband spectroscopy," Nature Scientific Reports, vol. 10, p. 2523, 2020.

[52] T. Fortier and E. Baumann, "20 years of developments in optical frequency comb technology and applications," Communication Physics, vol. 2, no. 153, 2019.

[53] A. D. J. Fernandez Olvera, B. L. Krause and S. Preu, "A True Optoelectronic Spectrum Analyzer for Millimeter Waves With Hz Resolution," IEEE Access, vol. 9, pp. 114339 to 114347, 2021.

[54] A. D. J. Fernandez Olvera, A. K. Mukherjee and S. Preu, "A Fully Optoelectronic Continuous-Wave 2-Port Vector Network Analyzer Operating From 0.1 THz to 1 THz," IEEE Journal of Microwaves, vol. 1, no. 4, pp. 1015 to 1022, Oct. 2021.

[55] V. K. Chinni et al., "Single-channel 100 Gbit/s transmission using III–V UTC-PDs for future IEEE 802.15.3d wireless links in the 300 GHz band," Electronics Letters, vol. 54, pp. 638 to 640, 2018.

[56] T. Nagatsuma et al., "Real-time 100-Gbit/s QPSK transmission using photonics-based 300-GHz-band wireless link," 2016 IEEE International Topical Meeting on Microwave Photonics (MWP), pp. 27 to 30, 2016.

[57] C. Castro et al., "32 GBd 16QAM Wireless Transmission in the 300 GHz Band using a PIN Diode for THz Upconversion," Optical Fiber Communications Conference and Exhibition (OFC), pp. 1 to 3, 2019.

[58] I. Dan, G. Ducournau, I. Kalfass et al., "A 300-GHz Wireless Link Employing a Photonic Transmitter and an Active Electronic Receiver With a Transmission Bandwidth of 54 GHz," IEEE Transactions on Terahertz Science and Technology, vol. 10, no. 3, pp. 271 to 281, May 2020.

[59] S. Koenig, D. Lopez-Diaz, J. Antes et al., "Wireless sub-THz communication system with high data rate," Nature Photonics, vol. 7, pp. 977 to 981, 2013.

[60] D. Stanze, A. Deninger, A. Roggenbuck, et al., "Compact CW Terahertz Spectrometer Pumped at 1.5 μm Wavelength," Journal of Infrared, Millimeter, and Terahertz Waves, vol. 32, pp. 225 to 232, 2011.

[61] N. Vieweg, F. Rettich, A. Deninger et al., "Terahertz-time domain spectrometer with 90 dB peak dynamic range," Journal of Infrared, Millimeter, and Terahertz Waves, vol. 35, pp. 823 to 832, 2014.

[62] F. Roccaforte and M. Leszczynski, Nitride Semiconductor Technology: Power Electronics and Optoelectronic Devices, Wiley-VCH Verlag GmbH & Co. KGaA, 2020.

[63] S. Nakamura, "Nobel Lecture: Background story of the invention of efficient blue InGaN light emitting diodes," Rev. Mod. Phys., vol. 87, p. 1139, 2015.

[64] M. Cwiklinski, "Design of Millimeter-Wave Power Amplifiers in GaN HEMT Technology," Ph.D. Dissertation, 2021.

[65] H. Wang et al., "Power Amplifiers Performance Survey 2000-Present," https://gems.ece.gatech.edu/PA_survey.html.

[66] B. Gashi et al., "Broadband 400-GHz InGaAs mHEMT Transmitter and Receiver S-MMICs," IEEE Transactions on Terahertz Science and Technology, vol. 11, no. 6, pp. 660 to 675, Nov. 2021.

[67] X. Mei et al., "First Demonstration of Amplification at 1 THz Using 25-nm InP High Electron Mobility Transistor Process," IEEE Electron Device Letters, vol. 36, no. 4, pp. 327 to 329, April 2015.

[68] ITU-R, "Draft working document towards a preliminary draft new Report ITU-R M.[IMT.ABOVE 100 GHz TECHNICAL FEASIBILITY OF IMT IN BANDS ABOVE 100 GHz]," ITU, 2022.

[69] "3GPP TR 38.901 (V16.0.0): Study on channel model for frequencies from 0.5 to 100 GHz," 3rd Generation Partnership Project (3GPP), October 2019.

[70] S. Salous, Radio Propagation Measurement and Channel Modelling, Wiley, 2013.

[71] M. Peter, W. Keusgen, T. Eichler, K. Yanagisawa, K. Kitao, T. Imai, M. Inomata, Y. Okumura and T. Nakamura, "High-Resolution Directional Channel Measurements at 67 GHz and Advanced Analysis of Interactions Using Geometric Information," 2018 IEEE International Symposium on Antennas and Propagation & USNC/URSI National Radio Science Meeting, pp. 77 to 78, 2018.

[72] M. Schmieder, T. Eichler, S. Wittig, M. Peter and W. Keusgen, "Measurement and Characterization of an Indoor Industrial Environment at 3.7 and 28 GHz," 2020 14th European Conference on Antennas and Propagation (EuCAP), pp. 1 to 5, 2020.

[73] M. Schmieder, W. Keusgen, M. Peter, S. Wittig, T. Merkle, S. Wagner, M. Kuri and T. Eichler, "THz Channel Sounding: Design and Validation of a High Performance Channel Sounder at 300 GHz," 2020 IEEE Wireless Communications and Networking Conference Workshops (WCNCW), pp. 1 to 6, 2020.

[74] F. Undi, A. Schultze, W. Keusgen, M. Peter and T. Eichler, "Angle-Resolved THz Channel Measurements at 300 GHz in an Outdoor Environment," 2021 IEEE International Conference on Communications Workshops (ICC Workshops), pp. 1 to 7, 2021.

[75] A. Schultze, F. Undi, M. Peter, W. Keusgen and T. Eichler, "Angle-Resolved THz Channel Measurements at 300 GHz in a Conference Room Environment," 2021 XXXIVth General Assembly and Scientific Symposium of the International Union of Radio Science (URSI GASS), pp. 1 to 4, 2021.

[76] S. Wittig, W. Keusgen, M. Peter and T. Eichler, "On the Dynamic Range of Digital Correlative Time Domain Radio Channel Measurements," arXiv:2008.07805, 2020.

[77] W. Keusgen, A. Schultze, M. Peter and T. Eichler, "Sub-THz Channel Measurements at 158 GHz and 300 GHz in a Street Canyon Environment," in submitted to 2022 Joint European Conference on Networks and Communications & 6G Summit (EuCNC/6G Summit), https://arxiv.org/abs/2203.04404, Grenoble, 2022.

[78] A. Schultze, W. Keusgen, M. Peter and T. Eichler, "Observations on the Angular Statistics of the Indoor Sub-THz Radio Channel at 158 GHz," 2022 IEEE USNC-URSI Radio Science Meeting (Joint with AP-S Symposium), pp. 9 to 10, doi: 10.23919/USNC-URSI52669.2022.9887443, https://ieeexplore.ieee.org/document/9887443, 2022.

注意:创建此文档时,所有链接都已检查并正常工作。然而,我们不能排除引用列表中的链接后续更新。

英文出处 IEEE ComSoc: https://www.comsoc.org/publications/white-papers

一、准备“武器”

本文是通过虚拟机搭建 OOS 测试环境的,4567是3的前提,
武器提取 le73

1、VMWare Workstation 17 Player
2、Windows Server 2016 镜像(需要 Office Online Server 2017 年 4 月或更高版本)
3、Office Online Server 2016(简称 OOS)
4、NET Framework 4.5.2(NDP452-KB2901954-Web.exe)
5、Visual C++ Redistributable Packages for Visual Studio 2013(vcredist_x64.exe)
6、Visual C++ Redistributable for Visual Studio 2015(vc_redist.x64.exe 提示已存在高版本就不用装了)
7、Microsoft.IdentityModel.Extention.dll(MicrosoftIdentityExtensions-64.msi)

二、搭建环境

从VMWare装起,这个简单就不说了,下一步、下一步。。。完成之后,新建两个虚拟机:OOSYU、OOS,前者是域控服务器,后者需要加入到域中,注意:两个系统都要纯净,OOS服务器内存6G起步,磁盘60G起步,配置低了影响性能。OOS联网安装更方便,提前设置网络连接为桥接,勾选复制物理网络,配置适配器选自己使用的网卡。

1、域控服务器

(1)服务器管理 ——> 添加角色和功能 ——> 一直点下一步到 “服务器角色”
(2)勾选 Active Directory 域服务,添加功能继续下一步到 “功能”
(3)勾选 .NET Framework 3.5 一直点下一步、安装
(4)点击“此服务器提升为域控制器”,进入AD域服务器配置向导
(5)勾选“添加新林”,填写域名,例如:oosview.com
(6)下一步,输入密码,后续全部默认下一步、安装,NetBIOS会自动带入
(7)网络设置,固定IP、DNS(参考宿主机),关闭防火墙确保能互相PING通
(8)域账户登录,密码是(6)设置的,“此电脑”右键属性,显示配置的域名即成功

2、OOS服务器

(1)网络设置,固定IP,DNS设置为域控服务器的IP
(2)电脑属性 ——> 更改设置 ——> 更改 ——> 填写计算机名,例如 office,勾选域填写域名 oosview.com(添加新林时的域名)
(3)点击确定,输入用户名密码,重启电脑用管理员登录,显示域代表入域成功

(4)以管理员身份打开“Windows PowerShell”输入下面命令:
Add-WindowsFeature Web-Server,Web-Mgmt-Tools,Web-Mgmt-Console,Web-WebServer,Web-Common-Http,Web-Default-Doc,Web-Static-Content,Web-Performance,Web-Stat-Compression,Web-Dyn-Compression,Web-Security,Web-Filtering,Web-Windows-Auth,Web-App-Dev,Web-Net-Ext45,Web-Asp-Net45,Web-ISAPI-Ext,Web-ISAPI-Filter,Web-Includes,NET-Framework-Features,NET-Framework-45-Features,NET-Framework-Core,NET-Framework-45-Core,NET-HTTP-Activation,NET-Non-HTTP-Activ,NET-WCF-HTTP-Activation45,Windows-Identity-Foundation,Server-Media-Foundation
(5)等待必需的角色和服务安装完成,顺序安装“武器”中的 4、5、6、7,最后安装 3
(6)重新以管理员身份打开“Windows PowerShell”,开始配置office online server,输入下面命令启动服务场
Import-Module OfficeWebApps
(7)输入下面命令并按提示输入Y回车以部署服务厂:
New-OfficeWebAppsFarm -InternalURL "http://office.oosview.com" -AllowHttp -EditingEnabled
(8)打开
http://office.oosview.com/hosting/discovery、http://office.oosview.com/op/generate.aspx
,出现以下页面表示成功:


如果第二个页面报错,再次运行下面命令:
Set-OfficeWebAppsFarm -OpenFromUrlEnabled:$true

(9)修改打开文档大小限制,打开 C:\Program Files\Microsoft Office Web Apps 目录中 OperFromUrlHost、OperFromUrlWeb 文件夹中的 Settings_Service.ini 配置文件,填写
OpenFromUrlMaxFileSizeInKBytes=(System.Int32)512000
并保存

三、预览效果

word、excel、ppt、pdf(注意:文档链接必须可以被直接访问,且需要是域名不能是 IP,本机可配置 HOST 测试用)



有这样一个带有搜索功能的用户界面需求:

搜索流程如下所示:

这个需求涉及两个实体:

  • “评分(Rating)、用户名(Username)”数据与
    User
    实体相关
  • “创建日期(create date)、观看次数(number of views)、标题(title)、正文(body)”与
    Story
    实体相关

需要支持的功能对
User
实体中的评分(Rating)的频繁修改以及下列搜索功能:

  • 按User评分进行范围搜索
  • 按Story创建日期进行范围搜索
  • 按Story浏览量进行范围搜索
  • 按Story标题进行全文搜索
  • 按Story正文进行全文搜索

Postgres中创建表结构和索引

创建
users
表和
stories
表以及对应搜索需求相关的索引,包括:

  • 使用 btree 索引来支持按User评分搜索
  • 使用 btree 索引来支持按Story创建日期、查看次数的搜索
  • 使用 gin 索引来支持全文搜索内容(同时创建全文搜索列
    fulltext
    ,类型使用
    tsvector
    以支持全文搜索)

具体创建脚本如下:

--Create Users table
CREATE TABLE IF NOT EXISTS users
(
  id bigserial NOT NULL,
  name character varying(100) NOT NULL,
rating integer,
PRIMARY KEY (id)
)
;
CREATE INDEX usr_rating_idx
ON users USING btree
(rating ASC NULLS LAST)
TABLESPACE pg_default
;

--Create Stories table
CREATE TABLE  IF NOT EXISTS stories
(
    id bigserial NOT NULL,
    create_date timestamp without time zone NOT NULL,
    num_views bigint NOT NULL,
    title text NOT NULL,
    body text NOT NULL,
    fulltext tsvector,
    user_id bigint,
    PRIMARY KEY (id),
CONSTRAINT user_id_fk FOREIGN KEY (user_id)
REFERENCES users (id) MATCH SIMPLE
ON UPDATE NO ACTION
ON DELETE NO ACTION
NOT VALID
)
;
CREATE INDEX str_bt_idx
ON stories USING btree
(create_date ASC NULLS LAST,
num_views ASC NULLS LAST, user_id ASC NULLS LAST)
;

CREATE INDEX fulltext_search_idx
ON stories USING gin
(fulltext)
;

创建Spring Boot应用

  1. 项目依赖关系(这里使用Gradle构建):
plugins {
   id 'java'
   id 'org.springframework.boot' version '3.1.3'
   id 'io.spring.dependency-management' version '1.1.3'
}

group = 'com.example'
version = '0.0.1-SNAPSHOT'

java {
   sourceCompatibility = '17'
}

repositories {
   mavenCentral()
}

dependencies {
   implementation 'org.springframework.boot:spring-boot-starter-data-jdbc'
   implementation 'org.springframework.boot:spring-boot-starter-web'
   runtimeOnly 'org.postgresql:postgresql'
   testImplementation 'org.springframework.boot:spring-boot-starter-test'
}

tasks.named('test') {
   useJUnitPlatform()
}
  1. application.yaml
    中配置数据库连接信息
spring:
  datasource: 
    url: jdbc:postgresql://localhost:5432/postgres
    username: postgres
    password: postgres
  1. 数据模型

定义需要用到的各种数据模型:

public record Period(String fieldName, LocalDateTime min, LocalDateTime max) {
}

public record Range(String fieldName, long min, long max) {
}

public record Search(List<Period> periods, List<Range> ranges, String fullText, long offset, long limit) {
}

public record UserStory(Long id, LocalDateTime createDate, Long numberOfViews,
                        String title, String body, Long userRating, String userName, Long userId) {
}

这里使用
Java 16推出的新特性record
实现,所以代码非常简洁。如果您还不了解的话,可以前往
程序猿DD的Java新特性专栏
补全一下知识点。

  1. 数据访问(Repository)
@Repository
public class UserStoryRepository {

    private final JdbcTemplate jdbcTemplate;


    @Autowired
    public UserStoryRepository(JdbcTemplate jdbcTemplate) {
        this.jdbcTemplate = jdbcTemplate;
    }

    public List<UserStory> findByFilters(Search search) {
        return jdbcTemplate.query(
                """
                  SELECT s.id id, create_date, num_views, 
                         title, body, user_id, name user_name, 
                         rating user_rating 
                  FROM stories s INNER JOIN users u 
                      ON s.user_id = u.id
                  WHERE true
                """ + buildDynamicFiltersText(search)
                        + " order by create_date desc offset ? limit ?",
                (rs, rowNum) -> new UserStory(
                        rs.getLong("id"),
                        rs.getTimestamp("create_date").toLocalDateTime(),
                        rs.getLong("num_views"),
                        rs.getString("title"),
                        rs.getString("body"),
                        rs.getLong("user_rating"),
                        rs.getString("user_name"),
                        rs.getLong("user_id")
                ),
                buildDynamicFilters(search)
        );
    }

    public void save(UserStory userStory) {
        var keyHolder = new GeneratedKeyHolder();

        jdbcTemplate.update(connection -> {
            PreparedStatement ps = connection
                .prepareStatement(
                    """
                      INSERT INTO stories (create_date, num_views, title, body, user_id)
                          VALUES (?, ?, ?, ?, ?)
                    """,
                    Statement.RETURN_GENERATED_KEYS
            );
            ps.setTimestamp(1, Timestamp.valueOf(userStory.createDate()));
            ps.setLong(2, userStory.numberOfViews());
            ps.setString(3, userStory.title());
            ps.setString(4, userStory.body());
            ps.setLong(5, userStory.userId());

            return ps;
        }, keyHolder);

        var generatedId = (Long) keyHolder.getKeys().get("id");

        if (generatedId != null) {
            updateFullTextField(generatedId);
        }
    }

    private void updateFullTextField(Long generatedId) {
        jdbcTemplate.update(
            """
              UPDATE stories SET fulltext = to_tsvector(title || ' ' || body)
              where id = ?
            """,
            generatedId
        );
    }

    private Object[] buildDynamicFilters(Search search) {
        var filtersStream = search.ranges().stream()
                .flatMap(
                    range -> Stream.of((Object) range.min(), range.max())
                );

        var periodsStream = search.periods().stream()
                .flatMap(
                    range -> Stream.of((Object) Timestamp.valueOf(range.min()), Timestamp.valueOf(range.max()))
                );

        filtersStream = Stream.concat(filtersStream, periodsStream);

        if (!search.fullText().isBlank()) {
            filtersStream = Stream.concat(filtersStream, Stream.of(search.fullText()));
        }

        filtersStream = Stream.concat(filtersStream, Stream.of(search.offset(), search.limit()));

        return filtersStream.toArray();
    }

    private String buildDynamicFiltersText(Search search) {
        var rangesFilterString =
                Stream.concat(
                  search.ranges()
                        .stream()
                        .map(
                            range -> String.format(" and %s between ? and ? ", range.fieldName())
                        ),
                  search.periods()
                        .stream()
                        .map(
                            range -> String.format(" and %s between ? and ? ", range.fieldName())
                        )
                  )
                  .collect(Collectors.joining(" "));

        return rangesFilterString + buildFulltextFilterText(search.fullText());
    }

    private String buildFulltextFilterText(String fullText) {
        return fullText.isBlank() ? "" : " and fulltext @@ plainto_tsquery(?) ";
    }
}
  1. Controller实现
@RestController
@RequestMapping("/user-stories")
public class UserStoryController {
    private final UserStoryRepository userStoryRepository;

    @Autowired
    public UserStoryController(UserStoryRepository userStoryRepository) {
        this.userStoryRepository = userStoryRepository;
    }

    @PostMapping
    public void save(@RequestBody UserStory userStory) {
        userStoryRepository.save(userStory);
    }

    @PostMapping("/search")
    public List<UserStory> search(@RequestBody Search search) {
        return userStoryRepository.findByFilters(search);
    }
}

小结

本文介绍了如何在Spring Boot中结合Postgres数据库实现全文搜索的功能,该方法比起使用Elasticsearch更为轻量级,非常适合一些小项目场景使用。希望本文内容对您有所帮助。如果您学习过程中如遇困难?可以加入我们超高质量的
Spring技术交流群
,参与交流与讨论,更好的学习与进步!更多
Spring Boot教程可以点击直达!
,欢迎收藏与转发支持!

参考资料

欢迎关注我的公众号:程序猿DD。第一时间了解前沿行业消息、分享深度技术干货、获取优质学习资源

探索AI视频生成新纪元:文生视频Sora VS RunwayML、Pika及StableVideo——谁将引领未来

由于在AI生成视频的时长上成功突破到一分钟,再加上演示视频的高度逼真和高质量,Sora立刻引起了轰动。在Sora横空出世之前,Runway一直被视为AI生成视频的默认选择,尤其是自去年11月推出第二代模型以来,Runway还被称为“AI视频界的MidJourney”。第二代模型Gen-2不仅解决了第一代AI生成视频中每帧之间连贯性过低的问题,在从图像生成视频的过程中也能给出很好的结果。

Sora最震撼的技术突破之一在于其输出的视频时长。Runway能够生成4秒长的视频,用户可以将其最多延长至16秒,是AI生成视频在2023年所能达到的最长时长纪录。Stable Video也提供4秒的视频,Pika则提供3秒的视频。在这一方面,Sora以1分钟的时长向竞争对手们提出了挑战。本质上,Sora和Pika、Runway采用了相似的底层模型,即Diffusion扩散模型。不同之处在于,Sora把其中的实现逻辑进行了变化,将U-Net架构替换成了Transformer架构。

1.文生视频效果展示对比:

1.1 sora之前模型效果

  • StableVideo效果展示

可以看到效果一般能比较明显看出差别

1.2 主流视频生成模型对比[Sora VS RunwayML、Pika]

让机器生成视频,难点在于“逼真”。比如一个人在同一个视频里的长焦和短焦镜头里外观不会变化;随着镜头转动,站在山崖上的小狗应该跟山崖保持一致的移动;咬一口面包,面包就会少一块并出现牙印……这些逻辑对人来说似乎显而易见,但AI模型很难领悟到前一帧和后一帧画面之间的各种逻辑和关联。

首先要强调下生成式AI模型跟传统信息检索的区别。传统检索是按图索骥,从数据库固定位置调取信息,准确度高,但不具备举一反三的能力。而生成式AI模型不会去记住数据本身,而是从大量数据中去学习和掌握生成语言、图像或视频的某种方法,产生难以解释的“涌现”能力。

图源:
https://twitter.com/samsheffer/status/1758205467682357732
_

当然,随着 Sora 加入这场视频生成领域的战争,受到冲击最大的是同类竞品模型,比如 Runway、Pika、SDV、谷歌和 Meta。看到 Sora 的生成效果之后,很多人认为,Sora 对这些「前辈」来了一波降维打击。事实真的如此吗?有推特博主已经做了对比。

这位博主给 Sora、Pika、Runway、Stable Video 四个模型输入了相同的 prompt:

美丽、白雪皑皑的东京熙熙攘攘,镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天,在附近的摊位购物,绚丽的樱花花瓣随着雪花随风飘扬。

可以看到,相比于其他三个视频生成模型,Sora 在生成时长、连贯性等方面都有显著的优势。

图源:
https://twitter.com/gabor/status/1758282791547232482
_

这样的对比还有很多,比如输入相同的 prompt「一窝金毛幼犬在雪地里玩耍,它们的头从雪中探出来,被雪覆盖。」

图源:
https://twitter.com/DailyUpdatesNet/status/1758646902751670355
_

再比如输入相同的 prompt「几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走来,长长的毛毛在风中轻轻飘动,远处覆盖着积雪的树木和雄伟的雪山,午后的阳光、缕缕云彩和远处高高的太阳营造出温暖的光芒,低相机视野令人惊叹地捕捉到了大型毛茸茸的哺乳动物与美丽的摄影,景深。」

虽然 Runway 和 Pika 表现都不错,但 Sora 的生成质量具有压倒性的优势。

图源:
https://twitter.com/keitowebai/status/1758384152670577136
_

还有人对比了 Pika 1.0(去年四月)与 Sora,感叹不到 1 年的时间,AI 生成视频已经发生了翻天覆地的变化。

原视频:
https://twitter.com/QuintinAu/status/1758536835595124910
_

与此同时,更多创作者也晒出了他们使用 Sora 生成的视频,进一步验证了 Sora 的超强视频生成能力。

比如输入 prompt「一座巨大的大教堂里全是猫。放眼望去,到处都是猫。一个男人走进大教堂,向坐在王座上的巨型猫王鞠躬。」


_

图源:
https://twitter.com/billpeeb/status/1758650919430848991
_

比如输入 prompt「一座幽灵般的鬼屋,有友好的杰克灯笼和鬼魂人物,欢迎捣蛋鬼来到入口,倾斜移位摄影。」

图源:
https://twitter.com/billpeeb/status/1758658884582142310
_

比如输入 prompt「一个由水制成的人行走着,参观了一个美术馆,里面有许多不同风格的美丽艺术品。」

图源:
https://twitter.com/_tim_brooks/status/1758666264032280683
_

比如输入 prompt「人们在海滩放松的真实视频,一条鲨鱼从水中冒了出来,让所有人大吃一惊。」

图源:
https://twitter.com/_tim_brooks/status/1758655323576164830
_

2.Sora-OpenAI技术报告

技术报告地址
https://openai.com/research/video-generation-models-as-world-simulators

OpenAI在技术报告里总结了一些以前模型常用的视频生成和建模方法,包括循环网络、生成式对抗网络、自回归Transformer和扩散模型。它们只能生成固定尺寸、时长较短的视频。

OpenAI 在技术报告中重点展示了:
(1)将所有类型的视觉数据转化为统一表示,从而能够大规模训练生成模型的方法;
(2)对 Sora 的能力和局限性进行定性评估。

最近一段时间,视频生成是 AI 领域的重要方向,先前的许多工作研究了视频数据的生成建模方向,包括循环网络、生成对抗网络、自回归 transformer 和扩散模型。这些工作通常关注一小类视觉数据、较短的视频或固定大小的视频。与之不同的是,OpenAI 的 Sora 是视觉数据的通用模型,它可以生成不同时长、长宽比和分辨率的视频和图像,而且最多可以输出长达一分钟的高清视频。

2.1 视觉数据转为 Patches

大型语言模型通过在互联网规模的数据上进行训练,获得了出色的通用能力中,OpenAI 从这一点汲取了灵感。LLM 得以确立新范式,部分得益于创新了 token 使用的方法。研究人员们巧妙地将文本的多种模态 —— 代码、数学和各种自然语言统一了起来。在这项工作中,OpenAI 考虑了生成视觉数据的模型如何继承这种方法的好处。大型语言模型有文本 token,而 Sora 有视觉 patches。此前的研究已经证明 patches 是视觉数据模型的有效表示。OpenAI 发现 patches 是训练生成各种类型视频和图像的模型的可扩展且有效的表示。

在更高层面上,OpenAI 首先将视频压缩到较低维的潜在空间,然后将表示分解为时空 patches,从而将视频转换为 patches。

  • (自回归)长视频生成

Sora的一个重大突破是能够生成非常长的视频。制作2秒视频和1分钟视频的区别是巨大的。在Sora中,这可能是通过允许自回归采样的联合帧预测来实现的,但一个主要挑战是如何解决误差积累并保持质量/一致性。

2.2 视频压缩网络

Sora实现了将Transformer和扩散模型结合的创新,首先将不同类型的视觉数据转换成统一的视觉数据表示(视觉patch),然后将原始视频压缩到一个低维潜在空间,并将视觉表示分解成时空patch(相当于Transformer token),让Sora在这个潜在空间里进行训练并生成视频。接着做加噪去噪,输入噪声patch后Sora通过预测原始“干净”patch来生成视频。OpenAI发现训练计算量越大,样本质量就会越高,特别是经过大规模训练后,Sora展现出模拟现实世界某些属性的“涌现”能力。这也是为啥OpenAI把视频生成模型称作“世界模拟器”,并总结说持续扩展视频模型是一条模拟物理和数字世界的希望之路。

训练了一个降低视觉数据维度的网络。该网络将原始视频作为输入,并输出在时间和空间上压缩的潜在表示。Sora 在这个压缩的潜在空间中接受训练,而后生成视频。OpenAI 还训练了相应的解码器模型,将生成的潜在表示映射回像素空间。

  • 时空潜在 patches

给定一个压缩的输入视频,OpenAI 提取一系列时空 patches,充当 Transformer 的 tokens。该方案也适用于图像,因为图像可视为单帧视频。OpenAI 基于 patches 的表示使 Sora 能够对不同分辨率、持续时间和长宽比的视频和图像进行训练。在推理时,OpenAI 可以通过在适当大小的网格中排列随机初始化的 patches 来控制生成视频的大小。

  • 用于视频生成的缩放 Transformer

Sora 是个扩散模型;给定输入噪声 patches(以及文本提示等调节信息),训练出的模型来预测原始的「干净」patches。重要的是,Sora 是一个扩散 Transformer。Transformer 在各个领域都表现出了卓越的缩放特性,包括语言建模、计算机视觉、和图像生成。

在这项工作中,OpenAI 发现扩散 Transformers 也可以有效地缩放为视频模型。下面,OpenAI 展示了训练过程中具有固定种子和输入的视频样本的比较。随着训练计算的增加,样本质量显着提高。

  • 可变的持续时间,分辨率,宽高比

过去的图像和视频生成方法通常需要调整大小、进行裁剪或者是将视频剪切到标准尺寸,例如 4 秒的视频分辨率为 256x256。相反,该研究发现在原始大小的数据上进行训练,可以提供以下好处:

首先是采样的灵活性:Sora 可以采样宽屏视频 1920x1080p,垂直视频 1920x1080p 以及两者之间的视频。这使 Sora 可以直接以其天然纵横比为不同设备创建内容。Sora 还允许在生成全分辨率的内容之前,以较小的尺寸快速创建内容原型 —— 所有内容都使用相同的模型。

其次是改进帧和内容组成:研究者通过实证发现,使用视频的原始长宽比进行训练可以提升内容组成和帧的质量。将 Sora 在与其他模型的比较中,后者将所有训练视频裁剪成正方形,这是训练生成模型时的常见做法。经过正方形裁剪训练的模型(左侧)生成的视频,其中的视频主题只是部分可见。相比之下,Sora 生成的视频(右侧)具有改进的帧内容。

2.3 语言理解

训练文本到视频生成系统需要大量带有相应文本字幕的视频。研究团队将 DALL ・ E 3 中的重字幕(re-captioning)技术应用于视频。

具体来说,研究团队首先训练一个高度描述性的字幕生成器模型,然后使用它为训练集中所有视频生成文本字幕。研究团队发现,对高度描述性视频字幕进行训练可以提高文本保真度以及视频的整体质量。

与 DALL ・ E 3 类似,研究团队还利用 GPT 将简短的用户 prompt 转换为较长的详细字幕,然后发送到视频模型。这使得 Sora 能够生成准确遵循用户 prompt 的高质量视频。

  • 以图像和视频作为提示

我们已经看到了文本到视频的诸多生成示例。实际上,Sora 还可以使用其他输入,如已有的图像或视频。这使 Sora 能够执行各种图像和视频编辑任务 — 创建完美的循环视频、静态图像动画、向前或向后延长视频时间等。

为 DALL-E 图像制作动画

只要输入图像和提示,Sora 就能生成视频。下面展示了根据 DALL-E 2 和 DALL-E 3 图像生成的视频示例:

狗戴着贝雷帽、穿着黑色高领毛衣

带有 Sora 的云图像

视频内容拓展

Sora 还能够在开头或结尾扩展视频内容。以下是 Sora 从一段生成的视频向后拓展出的三个新视频。新视频的开头各不相同,拥有相同的结尾。

不妨使用这种方法无限延长视频的内容,实现「视频制作永动机」。

视频到视频编辑

扩散模型激发了多种根据文本 prompt 编辑图像和视频的方法。OpenAI 的研究团队将其中一种方法 ——SDEdit 应用于 Sora,使得 Sora 能够在零样本(zero-shot)条件下改变输入视频的风格和环境。

输入视频如下:

输出结果:

连接视频还可以使用 Sora 在两个输入视频之间逐渐进行转场,从而在具有完全不同主题和场景构成的视频之间创建无缝过渡。


2.4 图像生成能力

Sora 还能生成图像。为此,OpenAI 将高斯噪声 patch 排列在空间网格中,时间范围为一帧。该模型可生成不同大小的图像,最高分辨率可达 2048x2048。

涌现模拟能力

OpenAI 发现,视频模型在经过大规模训练后,会表现出许多有趣的新能力。这些能力使 Sora 能够模拟物理世界中的人、动物和环境的某些方面。这些特性的出现没有任何明确的三维、物体等归纳偏差 — 它们纯粹是规模现象。

三维一致性。Sora 可以生成动态摄像机运动的视频。随着摄像机的移动和旋转,人物和场景元素在三维空间中的移动是一致的。

长序列连贯性和目标持久性。视频生成系统面临的一个重大挑战是在对长视频进行采样时保持时间一致性。OpenAI 发现,虽然 Sora 并不总是能有效地模拟短距离和长距离的依赖关系,但它在很多时候仍然能做到这一点。例如,即使人、动物和物体被遮挡或离开画面,Sora 模型也能保持它们的存在。同样,它还能在单个样本中生成同一角色的多个镜头,并在整个视频中保持其外观。

与世界互动。Sora 有时可以模拟以简单方式影响世界状态的动作。例如,画家可以在画布上留下新的笔触,这些笔触会随着时间的推移而持续,或者一个人可以吃汉堡并留下咬痕。

模拟数字世界。Sora 还能模拟人工进程,视频游戏就是一个例子。Sora 可以通过基本策略同时控制 Minecraft 中的玩家,同时高保真地呈现世界及其动态。只需在 Sora 的提示字幕中提及 「Minecraft」,就能零样本激发这些功能。

这些功能表明,视频模型的持续扩展是开发物理和数字世界以及其中的物体、动物和人的高能力模拟器的一条大有可为的道路。

2.5 未来可优化方向

作为一款模拟器,Sora 目前还存在许多局限性。例如,它不能准确模拟许多基本交互的物理现象,如玻璃碎裂。其他交互,如吃食物,并不总能产生正确的物体状态变化。官方主页列举了该模型的其他常见失效模式,例如长时间样本中出现的不一致性或物体的自发出现。


不过,Sora 目前所展现的能力证明了持续扩大视频模型的规模是一个充满希望的方向,这也将助力物理和数字世界及其中的物体、动物和人类能够有更加精确的模拟。

更多详细内容,请参阅 Sora 原始技术报告。

参考链接: https://openai.com/research/video-generation-models-as-world-simulators

3. Sora总结

OpenAI 的研究论文《Video generation models as world simulators》探讨了在视频数据上进行大规模训练生成模型的方法。这项研究特别关注于文本条件扩散模型,这些模型同时在视频和图像上进行训练,处理不同时长、分辨率和宽高比的数据。研究中提到的最大模型 Sora 能够生成长达一分钟的高保真视频。以下是论文的一些关键点:

  1. 统一的视觉数据表示
    :研究者们将所有类型的视觉数据转换为统一的表示,以便进行大规模的生成模型训练。Sora 使用视觉补丁(patches)作为其表示方式,类似于大型语言模型(LLM)中的文本标记。

  2. 视频压缩网络
    :研究者们训练了一个网络,将原始视频压缩到一个低维潜在空间,并将其表示分解为时空补丁。Sora 在这个压缩的潜在空间中进行训练,并生成视频。

  3. 扩散模型
    :Sora 是一个扩散模型,它通过预测原始“干净”的补丁来从输入的噪声补丁中生成视频。扩散模型在语言建模、计算机视觉和图像生成等领域已经显示出了显著的扩展性。

  4. 视频生成的可扩展性
    :Sora 能够生成不同分辨率、时长和宽高比的视频,包括全高清视频。这种灵活性使得 Sora 能够直接为不同设备生成内容,或者在生成全分辨率视频之前快速原型化内容。

  5. 语言理解
    :为了训练文本到视频生成系统,需要大量的视频和相应的文本标题。研究者们应用了在 DALL·E 3 中引入的重新描述技术,首先训练一个高度描述性的标题生成器,然后为训练集中的所有视频生成文本标题。

  6. 图像和视频编辑
    :Sora 不仅能够基于文本提示生成视频,还可以基于现有图像或视频进行提示。这使得 Sora 能够执行广泛的图像和视频编辑任务,如创建完美循环的视频、动画静态图像、向前或向后扩展视频等。

  7. 模拟能力
    :当视频模型在大规模训练时,它们展现出了一些有趣的新兴能力,使得 Sora 能够模拟物理世界中的某些方面,如动态相机运动、长期一致性和对象持久性等。

尽管 Sora 展示了作为模拟器的潜力,但它仍然存在许多局限性,例如在模拟基本物理交互(如玻璃破碎)时的准确性不足。研究者们认为,继续扩展视频模型是开发物理和数字世界模拟器的有前途的道路。
这篇论文提供了对 Sora 模型的深入分析,展示了其在视频生成领域的潜力和挑战。通过这种方式,OpenAI 正在探索如何利用 AI 来更好地理解和模拟我们周围的世界。

更多优质内容请关注公号:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。

  • 参考链接:

stable-diffusion-videos:
https://github.com/nateraw/stable-diffusion-videos

StableVideo:
https://github.com/rese1f/StableVideo

sora官网:
https://openai.com/sora

sora报告的链接:
https://openai.com/research/video-generation-models-as-world-simulators