性能優化

C++ 以其性能能力而聞名，它提供了對硬體和記憶體的精細控制，這使得優化顯著。本模組探討了編寫高性能 C++ 程式碼的各種技術，並將其與 JavaScript 的性能特性進行了對比。

編譯器優化選項

現代 C++ 編譯器（如 GCC、Clang、MSVC）提供了各種優化標誌，可以顯著提高編譯程式碼的性能。這些優化在編譯時執行。

正在加载...

高效的記憶體存取對於性能至關重要，尤其是由於 CPU 快取。優化資料結構以獲得更好的記憶體局部性可以顯著減少快取未命中並提高性能。

快取局部性： 在記憶體中排列資料，使頻繁存取的項目彼此靠近。
結構填充： 編譯器可能會在結構中新增填充以使成員在記憶體邊界上對齊，這會影響大小和快取性能。使用 pragma pack 或重新排序成員以最小化填充。
結構陣列 (AoS) vs. 陣列結構 (SoA)：
- AoS： struct Point { float x, y, z; }; Point points[N]; (適用於存取單一物件的所有成員)。
- SoA： struct Points { float x[N], y[N], z[N]; }; (適用於存取許多物件中的單一成員，對於向量化操作具有更好的快取性能)。

正在加载...

正在加载...

編寫快取友好程式碼意味著組織資料和演算法以最大化快取命中並最小化快取未命中。CPU 以區塊（快取行）獲取資料，因此按順序存取資料或以符合快取行的模式存取資料是有益的。

為了有效地優化 C++ 程式碼，你需要識別性能瓶頸。分析工具對於此至關重要。

這些工具可幫助你精確找出程式花費大部分時間的位置，從而有效地集中優化工作。

特性	JavaScript	C++
執行模型	解釋型/JIT 編譯	編譯為原生機器碼
記憶體控制	自動 (垃圾回收)	手動/智能指針 (精細控制)
性能	對於 Web/UI 通常良好，但對於 CPU 密集型任務可能較慢	對於 CPU 密集型、低延遲和系統級任務表現出色
優化	依賴 JIT 編譯器啟發式	明確的編譯器標誌、手動記憶體/資料佈局、演算法選擇
確定性	GC 暫停可能引入不可預測的延遲	更具確定性的性能

C++ 由於其編譯為原生程式碼和直接記憶體存取，提供了卓越的原始性能。JavaScript 的性能在很大程度上依賴於其 JIT 編譯器的複雜性，這些編譯器可以執行令人印象深刻的優化，但仍在受管運行時環境的限制內運行。

先分析： 不要過早優化。使用分析工具識別實際瓶頸。
演算法和資料結構選擇： 為你的問題選擇最有效的演算法和資料結構（例如，std::unordered_map 用於快速查找，std::vector 用於順序存取）。
最小化記憶體分配： 動態記憶體分配（new/delete）比堆疊分配慢。盡可能重複使用記憶體，或為性能關鍵部分使用自訂分配器。
快取感知： 設計資料結構和存取模式以最大化快取命中。
避免熱路徑中的虛擬函式： 虛擬函式呼叫涉及虛擬表查找，這可能比直接呼叫稍慢。如果性能至關重要且不需要多態性，請避免使用虛擬函式。
正確使用 const： const 正確性可以啟用更多編譯器優化。
移動語義： 利用移動建構函式和移動賦值運算子 (C++11+) 以避免不必要的深層複製，尤其是在處理大型物件時。
並行： 對於多核心系統，利用多執行緒 (std::thread、OpenMP、TBB) 或 GPU 計算 (CUDA、OpenCL) 進行可並行化的任務。

在 C++ 中實作兩個版本的矩陣乘法演算法：一個簡單的實作和一個針對快取局部性優化的實作（例如，使用區塊矩陣乘法或轉置一個矩陣）。使用分析工具（如 perf 或 Valgrind 的 Cachegrind）來測量和比較它們對於大型矩陣的性能。記錄你的發現並根據快取行為解釋性能差異。