性能优化

C++ 以其性能能力而闻名，它提供了对硬件和内存的精细控制，这使得优化显著。本模块探讨了编写高性能 C++ 代码的各种技术，并将其与 JavaScript 的性能特性进行了对比。

编译器优化选项

现代 C++ 编译器（如 GCC、Clang、MSVC）提供了各种优化标志，可以显著提高编译代码的性能。这些优化在编译时执行。

正在加载...

高效的内存访问对于性能至关重要，尤其是由于 CPU 缓存。优化数据结构以获得更好的内存局部性可以显著减少缓存未命中并提高性能。

缓存局部性： 在内存中排列数据，使频繁访问的项彼此靠近。
结构填充： 编译器可能会在结构中添加填充以使成员在内存边界上对齐，这会影响大小和缓存性能。使用 pragma pack 或重新排序成员以最小化填充。
结构数组 (AoS) vs. 数组结构 (SoA)：
- AoS： struct Point { float x, y, z; }; Point points[N]; (适用于访问单个对象的所有成员)。
- SoA： struct Points { float x[N], y[N], z[N]; }; (适用于访问许多对象中的单个成员，对于向量化操作具有更好的缓存性能)。

正在加载...

正在加载...

编写缓存友好代码意味着组织数据和算法以最大化缓存命中并最小化缓存未命中。CPU 以块（缓存行）获取数据，因此按顺序访问数据或以符合缓存行的模式访问数据是有益的。

为了有效地优化 C++ 代码，你需要识别性能瓶颈。分析工具对于此至关重要。

这些工具可帮助你精确找出程序花费大部分时间的位置，从而有效地集中优化工作。

特性	JavaScript	C++
执行模型	解释型/JIT 编译	编译为原生机器码
内存控制	自动 (垃圾回收)	手动/智能指针 (精细控制)
性能	对于 Web/UI 通常良好，但对于 CPU 密集型任务可能较慢	对于 CPU 密集型、低延迟和系统级任务表现出色
优化	依赖 JIT 编译器启发式	明确的编译器标志、手动内存/数据布局、算法选择
确定性	GC 暂停可能引入不可预测的延迟	更具确定性的性能

C++ 提供了卓越的原始性能，因为它编译为原生代码并直接访问内存。JavaScript 的性能在很大程度上依赖于其 JIT 编译器的复杂性，这些编译器可以执行令人印象深刻的优化，但仍在受管运行时环境的限制内运行。

先分析： 不要过早优化。使用分析工具识别实际瓶颈。
算法和数据结构选择： 为你的问题选择最有效的算法和数据结构（例如，std::unordered_map 用于快速查找，std::vector 用于顺序访问）。
最小化内存分配： 动态内存分配（new/delete）比栈分配慢。尽可能重复使用内存，或为性能关键部分使用自定义分配器。
缓存感知： 设计数据结构和访问模式以最大化缓存命中。
避免热路径中的虚函数： 虚函数调用涉及虚表查找，这可能比直接调用稍慢。如果性能至关重要且多态性不是严格必需的，请避免使用虚函数。
正确使用 const： const 正确性可以启用更多编译器优化。
移动语义： 利用移动构造函数和移动赋值运算符 (C++11+) 以避免不必要的深层复制，尤其是在处理大型对象时。
并行： 对于多核系统，利用多线程 (std::thread、OpenMP、TBB) 或 GPU 计算 (CUDA、OpenCL) 进行可并行化的任务。

创建一个 C++ 程序，实现两个版本的矩阵乘法算法：一个朴素实现和一个针对缓存局部性优化的实现（例如，使用块矩阵乘法或转置一个矩阵）。使用分析工具（如 perf 或 Valgrind 的 Cachegrind）来测量和比较它们对于大型矩阵的性能。记录你的发现并根据缓存行为解释性能差异。