Fix matrix 3x3 inverse, improve LogLuv

cfnptr · cfnptr · commit 713a5847e6e0 · 2026-03-09T17:47:54.000+02:00
diff --git a/include/math/color-space.hpp b/include/math/color-space.hpp
@@ -176,30 +176,50 @@ static f32x4 xyyToRgb(f32x4 xyy) noexcept { return xyzToRgb(xyyToXyz(xyy)); }
 // Linear sRGB <-> LogLuv
 static const f32x4x4 rgbToLogLuvMat = f32x4x4
 (
-	f32x4(0.2209f, 0.3390f, 0.4184f, 0.0f),
-	f32x4(0.1138f, 0.6780f, 0.7319f, 0.0f),
-	f32x4(0.0102f, 0.1130f, 0.2969f, 0.0f),
+	f32x4(0.1832848040f, 0.2126390040f, 0.252131164f, 0.0f),
+	f32x4(0.1589263680f, 0.7151686540f, 0.788274765f, 0.0f),
+	f32x4(0.0802136883f, 0.0721923187f, 0.283475161f, 0.0f),
 	f32x4::zero
 );
 static const f32x4x4 logLuvToRgbMat = f32x4x4
 (
-	f32x4( 6.0014f, -2.7008f, -1.7996f, 0.0f),
-	f32x4(-1.3320f,  3.1029f, -5.7721f, 0.0f),
-	f32x4( 0.3008f, -1.0882f,  5.6268f, 0.0f),
+	f32x4( 7.666140550f, -2.211964610f, -0.667561352f, 0.0f),
+	f32x4( 0.955670714f,  1.668192390f, -5.488834380f, 0.0f),
+	f32x4(-2.412632940f,  0.201072842f,  5.114378450f, 0.0f),
 	f32x4::zero
 );
 
+static f32x4x4 calcLogLuvMat(const f32x4x4& rgbToXyzMat) noexcept
+{
+	static const f32x4x4 m1 = f32x4x4
+	(
+		f32x4(1.0f, 0.0f,  1.0f, 0.0f),
+		f32x4(0.0f, 1.0f, 15.0f, 0.0f),
+		f32x4(0.0f, 0.0f,  3.0f, 0.0f),
+		f32x4::zero
+	);
+	static const f32x4x4 m2 = f32x4x4
+	(
+		f32x4(4.0f / 9.0f, 0.0f,         0.0f, 0.0f),
+		f32x4(0.0f,        1.0f,         0.0f, 0.0f),
+		f32x4(0.0f,        0.0f, 0.62f / 9.0f, 0.0f),
+		f32x4::zero
+	);
+	return dot3x3(m2, dot3x3(m1, rgbToXyzMat));
+}
+
 /**
  * @brief Encodes linear RGB color (HDR) to the LogLuv format.
+ * @details Encodes log2(Y) in [-20,20) range.
  * @param rgb target linear RGB color
  */
 static uint32 rgbToLogLuv(f32x4 rgb) noexcept
 {
 	auto luv = max(dot3x3(rgbToLogLuvMat, rgb), f32x4(1e-6f));
-	auto uv = (uint2)fma(saturate((float2)luv / luv.getZ()), float2(255.0f), float2(0.5f));
-	auto logLuv = (uint32)std::fma(saturate(std::fma(std::log2(
-		luv.getY()), 1.0f / 64.0f, 0.5f)), 65535.0f, 0.5f);
-	logLuv |= (uv.x << 24u) | (uv.y << 16u);
+	auto uv = (uint2)fma(saturate((float2)luv / luv.getZ()), float2(511.0f), float2(0.5f));
+	auto le = (uint32)std::fma(saturate(std::fma(std::log2(
+		luv.getY()), (1.0f / 40.0f), 0.5f)), 16383.0f, 0.5f);
+	auto logLuv = (uv.y << 23u) | (uv.x << 14u) | le;
 	return dot3(rgb, rgb) > 0.0f ? logLuv : 0;
 }
 /**
@@ -208,8 +228,8 @@ static uint32 rgbToLogLuv(f32x4 rgb) noexcept
  */
 static f32x4 logLuvToRgb(uint32 logLuv)
 {
-	f32x4 luv; auto uv = float2(uint2(logLuv >> 24u, logLuv >> 16u) & 255u) * (1.0f / 255.0f);
-	luv.floats.y = std::exp2(std::fma(logLuv & 65535u, (1.0f / 65535.0f) * 64.0f, -32.0f));
+	f32x4 luv; auto uv = float2(uint2(logLuv >> 14u, logLuv >> 23u) & 511u) * (1.0f / 511.0f);
+	luv.floats.y = std::exp2(std::fma(logLuv & 16383u, 40.0f / 16383.0f, -20.0f));
 	luv.floats.z = luv.floats.y / uv.y; luv.floats.x = luv.floats.z * uv.x;
 	return logLuv > 0 ? max(dot3x3(logLuvToRgbMat, luv), f32x4::zero) : f32x4::zero;
 }
diff --git a/include/math/matrix/float.hpp b/include/math/matrix/float.hpp
@@ -778,30 +778,30 @@ static constexpr float4x4 transpose(float4x4 m) noexcept
  */
 static constexpr float2x2 inverse(float2x2 m) noexcept
 {
-	auto oneOverDeterminant = 1.0f / (m.c0.x * m.c1.y - m.c1.x * m.c0.y);
-	return float2x2(m.c1.y * oneOverDeterminant, -m.c0.y * oneOverDeterminant,
-		-m.c1.x * oneOverDeterminant, m.c0.x * oneOverDeterminant);
+	auto invDeterminant = 1.0f / (m.c0.x * m.c1.y - m.c1.x * m.c0.y);
+	return float2x2(m.c1.y * invDeterminant, -m.c0.y * invDeterminant,
+		-m.c1.x * invDeterminant, m.c0.x * invDeterminant);
 }
 /**
  * @brief Calculates matrix inverse. (Useful for undoing transformations)
  * @param matrix target matrix to inverse
  */
 static constexpr float3x3 inverse(float3x3 m) noexcept
 {
-	auto oneOverDeterminant = 1.0f / (
-		m.c0.x * (m.c1.y * m.c2.z - m.c2.y * m.c1.z)
+	auto invDeterminant = 1.0f / (
+		 m.c0.x * (m.c1.y * m.c2.z - m.c2.y * m.c1.z)
 		-m.c1.x * (m.c0.y * m.c2.z - m.c2.y * m.c0.z) +
-		m.c2.x * (m.c0.y * m.c1.z - m.c1.y * m.c0.z));
+		 m.c2.x * (m.c0.y * m.c1.z - m.c1.y * m.c0.z));
 	return float3x3(
-		(m.c1.y * m.c2.z - m.c2.y * m.c1.z) * oneOverDeterminant,
-		-(m.c0.y * m.c2.z - m.c2.y * m.c0.z) * oneOverDeterminant,
-		(m.c0.y * m.c2.z - m.c1.y * m.c0.z) * oneOverDeterminant,
-		-(m.c1.x * m.c2.z - m.c2.x * m.c1.z) * oneOverDeterminant,
-		(m.c0.x * m.c2.z - m.c2.x * m.c0.z) * oneOverDeterminant,
-		-(m.c0.x * m.c2.z - m.c1.x * m.c0.z) * oneOverDeterminant,
-		(m.c1.x * m.c2.y - m.c2.x * m.c1.y) * oneOverDeterminant,
-		-(m.c0.x * m.c2.y - m.c2.x * m.c0.y) * oneOverDeterminant,
-		(m.c0.x * m.c2.y - m.c1.x * m.c0.y) * oneOverDeterminant);
+		 (m.c1.y * m.c2.z - m.c2.y * m.c1.z) * invDeterminant,
+		-(m.c1.x * m.c2.z - m.c2.x * m.c1.z) * invDeterminant,
+		 (m.c1.x * m.c2.y - m.c2.x * m.c1.y) * invDeterminant,
+		-(m.c0.y * m.c2.z - m.c2.y * m.c0.z) * invDeterminant,
+		 (m.c0.x * m.c2.z - m.c2.x * m.c0.z) * invDeterminant,
+		-(m.c0.x * m.c2.y - m.c2.x * m.c0.y) * invDeterminant,
+		 (m.c0.y * m.c1.z - m.c1.y * m.c0.z) * invDeterminant,
+		-(m.c0.x * m.c1.z - m.c1.x * m.c0.z) * invDeterminant,
+		 (m.c0.x * m.c1.y - m.c1.x * m.c0.y) * invDeterminant);
 }
 /**
  * @brief Calculates matrix inverse. (Useful for undoing transformations)
diff --git a/include/math/simd/matrix/float.hpp b/include/math/simd/matrix/float.hpp
@@ -616,6 +616,32 @@ static f32x4x4 inverse4x4(const f32x4x4& m) noexcept
 	#endif
 }
 
-// TODO: inverse of the 3x3 matrix like in the Jolt lib.
+/**
+ * @brief Calculates 3x3 SIMD matrix determinant.
+ * @param[in] m target SIMD matrix
+ */
+static float calcDeterminant3x3(const f32x4x4& m) noexcept
+{
+	return dot3(m.c0, cross3(m.c1, m.c2));
+}
+/**
+ * @brief Calculates 3x3 SIMD matrix inverse. (Useful for undoing transformations)
+ * @param[in] m target SIMD matrix to inverse
+ */
+static f32x4x4 inverse3x3(const f32x4x4& m) noexcept
+{
+	auto invDeterminant = 1.0f / calcDeterminant3x3(m);
+	return f32x4x4(
+		 (m.c1[1] * m.c2[2] - m.c2[1] * m.c1[2]) * invDeterminant,
+		-(m.c1[0] * m.c2[2] - m.c2[0] * m.c1[2]) * invDeterminant,
+		 (m.c1[0] * m.c2[1] - m.c2[0] * m.c1[1]) * invDeterminant, 0.0f,
+		-(m.c0[1] * m.c2[2] - m.c2[1] * m.c0[2]) * invDeterminant,
+		 (m.c0[0] * m.c2[2] - m.c2[0] * m.c0[2]) * invDeterminant,
+		-(m.c0[0] * m.c2[1] - m.c2[0] * m.c0[1]) * invDeterminant, 0.0f,
+		 (m.c0[1] * m.c1[2] - m.c1[1] * m.c0[2]) * invDeterminant,
+		-(m.c0[0] * m.c1[2] - m.c1[0] * m.c0[2]) * invDeterminant,
+		 (m.c0[0] * m.c1[1] - m.c1[0] * m.c0[1]) * invDeterminant, 0.0f,
+		0.0f, 0.0f, 0.0f, 0.0f);
+}
 
 } // namespace math