是否有适合x86的双精度小型matrixSIMD库?

我正在寻找一个针对graphics的小型(4×4)matrix操作的SIMD库。 有很多单精度的,但我需要支持单精度和双精度。

我看过英特尔的IPP MX库,但我更喜欢源代码。 我对这些特定操作的SSE3 +实现非常感兴趣:

  1. Mat4 * Mat4
  2. Mat4 * Vec4
  3. Mat4 * Mat4数组
  4. Mat4 * Vec4数组
  5. Mat4反转(很好有)