[X86][Clang] Add constexpr support for _mm_min_ss/_mm_max_ss/_mm_min_sd/_mm_max_sd/_mm_min_sh/_mm_max_sh intrinsics (#178029)

- Added boolean IsScalar argument to the helper functions in InterpBuiltin/ExprConstant - Made minsh_round_mask, maxsh_round_mask constexpr only for _MM_FROUND_CUR_DIRECTION rounding mode. - Added helper function for scalar round mask in InterpBuiltin/ExprConstant Resolves #175198
2026-02-23 06:03:57 -08:00 · 2026-02-23 06:03:57 -08:00 · 595c5bcdc5
commit 595c5bcdc5
parent 92447ed273
14 changed files with 904 additions and 77 deletions
--- a/clang/include/clang/Basic/BuiltinsX86.td
+++ b/clang/include/clang/Basic/BuiltinsX86.td
@ -82,15 +82,6 @@ let Attributes = [Const, NoThrow, RequiredVectorWidth<128>] in {
    }
  }

-  foreach Op = ["min", "max"] in {
-    let Features = "sse" in {
-      def Op#ss : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>)">;
-    }
-    let Features = "sse2" in {
-      def Op#sd : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>)">;
-    }
-  }
-
  let Features = "sse" in {
    def cmpps : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Constant char)">;
    def cmpss : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Constant char)">;
@ -160,6 +151,8 @@ let Features = "sse", Attributes = [NoThrow, Const, Constexpr, RequiredVectorWid
  def shufps : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Constant int)">;
  def minps : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>)">;
  def maxps : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>)">;
+  def minss : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>)">;
+  def maxss : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>)">;
 }

 let Features = "sse", Attributes = [NoThrow, Const, RequiredVectorWidth<128>] in {
@ -250,6 +243,8 @@ let Features = "sse2", Attributes = [NoThrow, Const, Constexpr, RequiredVectorWi

  def minpd : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>)">;
  def maxpd : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>)">;
+  def minsd : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>)">;
+  def maxsd : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>)">;

  def psllwi128 : X86Builtin<"_Vector<8, short>(_Vector<8, short>, int)">;
  def pslldi128 : X86Builtin<"_Vector<4, int>(_Vector<4, int>, int)">;
@ -1352,19 +1347,22 @@ let Features = "avx512f", Attributes = [NoThrow, Const, RequiredVectorWidth<512>
  def subps512 : X86Builtin<"_Vector<16, float>(_Vector<16, float>, _Vector<16, float>, _Constant int)">;
 }

+let Features = "avx512f", Attributes = [NoThrow, Const, Constexpr, RequiredVectorWidth<128>] in {
+  def maxss_round_mask : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Vector<4, float>, unsigned char, _Constant int)">;
+  def minss_round_mask : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Vector<4, float>, unsigned char, _Constant int)">;
+  def maxsd_round_mask : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>, _Vector<2, double>, unsigned char, _Constant int)">;
+  def minsd_round_mask : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>, _Vector<2, double>, unsigned char, _Constant int)">;
+}
+
 let Features = "avx512f", Attributes = [NoThrow, Const, RequiredVectorWidth<128>] in {
  def addss_round_mask : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Vector<4, float>, unsigned char, _Constant int)">;
  def divss_round_mask : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Vector<4, float>, unsigned char, _Constant int)">;
  def mulss_round_mask : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Vector<4, float>, unsigned char, _Constant int)">;
  def subss_round_mask : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Vector<4, float>, unsigned char, _Constant int)">;
-  def maxss_round_mask : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Vector<4, float>, unsigned char, _Constant int)">;
-  def minss_round_mask : X86Builtin<"_Vector<4, float>(_Vector<4, float>, _Vector<4, float>, _Vector<4, float>, unsigned char, _Constant int)">;
  def addsd_round_mask : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>, _Vector<2, double>, unsigned char, _Constant int)">;
  def divsd_round_mask : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>, _Vector<2, double>, unsigned char, _Constant int)">;
  def mulsd_round_mask : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>, _Vector<2, double>, unsigned char, _Constant int)">;
  def subsd_round_mask : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>, _Vector<2, double>, unsigned char, _Constant int)">;
-  def maxsd_round_mask : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>, _Vector<2, double>, unsigned char, _Constant int)">;
-  def minsd_round_mask : X86Builtin<"_Vector<2, double>(_Vector<2, double>, _Vector<2, double>, _Vector<2, double>, unsigned char, _Constant int)">;
 }

 let Features = "avx512vl", Attributes = [NoThrow, Const, RequiredVectorWidth<128>] in {
@ -3403,6 +3401,11 @@ let Features = "avx512fp16", Attributes = [NoThrow, Const, Constexpr, RequiredVe
  def minph512 : X86Builtin<"_Vector<32, _Float16>(_Vector<32, _Float16>, _Vector<32, _Float16>, _Constant int)">;
 }

+let Features = "avx512fp16", Attributes = [NoThrow, Const, Constexpr, RequiredVectorWidth<128>] in {
+  def maxsh_round_mask : X86Builtin<"_Vector<8, _Float16>(_Vector<8, _Float16>, _Vector<8, _Float16>, _Vector<8, _Float16>, unsigned char, _Constant int)">;
+  def minsh_round_mask : X86Builtin<"_Vector<8, _Float16>(_Vector<8, _Float16>, _Vector<8, _Float16>, _Vector<8, _Float16>, unsigned char, _Constant int)">;
+}
+
 let Features = "avx512fp16,avx512vl", Attributes = [NoThrow, Const, Constexpr, RequiredVectorWidth<256>] in {
  def minph256 : X86Builtin<"_Vector<16, _Float16>(_Vector<16, _Float16>, _Vector<16, _Float16>)">;
  def maxph256 : X86Builtin<"_Vector<16, _Float16>(_Vector<16, _Float16>, _Vector<16, _Float16>)">;
@ -3418,8 +3421,6 @@ let Features = "avx512fp16", Attributes = [NoThrow, Const, RequiredVectorWidth<1
  def divsh_round_mask : X86Builtin<"_Vector<8, _Float16>(_Vector<8, _Float16>, _Vector<8, _Float16>, _Vector<8, _Float16>, unsigned char, _Constant int)">;
  def mulsh_round_mask : X86Builtin<"_Vector<8, _Float16>(_Vector<8, _Float16>, _Vector<8, _Float16>, _Vector<8, _Float16>, unsigned char, _Constant int)">;
  def subsh_round_mask : X86Builtin<"_Vector<8, _Float16>(_Vector<8, _Float16>, _Vector<8, _Float16>, _Vector<8, _Float16>, unsigned char, _Constant int)">;
-  def maxsh_round_mask : X86Builtin<"_Vector<8, _Float16>(_Vector<8, _Float16>, _Vector<8, _Float16>, _Vector<8, _Float16>, unsigned char, _Constant int)">;
-  def minsh_round_mask : X86Builtin<"_Vector<8, _Float16>(_Vector<8, _Float16>, _Vector<8, _Float16>, _Vector<8, _Float16>, unsigned char, _Constant int)">;
 }

 let Features = "avx512fp16", Attributes = [NoThrow, Const, RequiredVectorWidth<512>] in {
--- a/clang/lib/AST/ByteCode/InterpBuiltin.cpp
+++ b/clang/lib/AST/ByteCode/InterpBuiltin.cpp
@ -2509,7 +2509,8 @@ static bool interp__builtin_elementwise_fp_binop(
    InterpState &S, CodePtr OpPC, const CallExpr *Call,
    llvm::function_ref<std::optional<APFloat>(
        const APFloat &, const APFloat &, std::optional<APSInt> RoundingMode)>
-        Fn) {
+        Fn,
+    bool IsScalar = false) {
  assert((Call->getNumArgs() == 2) || (Call->getNumArgs() == 3));
  const auto *VT = Call->getArg(0)->getType()->castAs<VectorType>();
  assert(VT->getElementType()->isFloatingType());
@ -2532,6 +2533,10 @@ static bool interp__builtin_elementwise_fp_binop(
  const Pointer &Dst = S.Stk.peek<Pointer>();
  for (unsigned ElemIdx = 0; ElemIdx != NumElems; ++ElemIdx) {
    using T = PrimConv<PT_Float>::T;
+    if (IsScalar && ElemIdx > 0) {
+      Dst.elem<T>(ElemIdx) = APtr.elem<T>(ElemIdx);
+      continue;
+    }
    APFloat ElemA = APtr.elem<T>(ElemIdx).getAPFloat();
    APFloat ElemB = BPtr.elem<T>(ElemIdx).getAPFloat();
    std::optional<APFloat> Result = Fn(ElemA, ElemB, RoundingMode);
@ -2545,6 +2550,43 @@ static bool interp__builtin_elementwise_fp_binop(
  return true;
 }

+static bool interp__builtin_scalar_fp_round_mask_binop(
+    InterpState &S, CodePtr OpPC, const CallExpr *Call,
+    llvm::function_ref<std::optional<APFloat>(const APFloat &, const APFloat &,
+                                              std::optional<APSInt>)>
+        Fn) {
+  assert(Call->getNumArgs() == 5);
+  const auto *VT = Call->getArg(0)->getType()->castAs<VectorType>();
+  unsigned NumElems = VT->getNumElements();
+
+  APSInt RoundingMode = popToAPSInt(S, Call->getArg(4));
+  uint64_t MaskVal = popToUInt64(S, Call->getArg(3));
+  const Pointer &SrcPtr = S.Stk.pop<Pointer>();
+  const Pointer &BPtr = S.Stk.pop<Pointer>();
+  const Pointer &APtr = S.Stk.pop<Pointer>();
+  const Pointer &Dst = S.Stk.peek<Pointer>();
+
+  using T = PrimConv<PT_Float>::T;
+
+  if (MaskVal & 1) {
+    APFloat ElemA = APtr.elem<T>(0).getAPFloat();
+    APFloat ElemB = BPtr.elem<T>(0).getAPFloat();
+    std::optional<APFloat> Result = Fn(ElemA, ElemB, RoundingMode);
+    if (!Result)
+      return false;
+    Dst.elem<T>(0) = static_cast<T>(*Result);
+  } else {
+    Dst.elem<T>(0) = SrcPtr.elem<T>(0);
+  }
+
+  for (unsigned I = 1; I < NumElems; ++I)
+    Dst.elem<T>(I) = APtr.elem<T>(I);
+
+  Dst.initializeAllElements();
+
+  return true;
+}
+
 static bool interp__builtin_elementwise_int_binop(
    InterpState &S, CodePtr OpPC, const CallExpr *Call,
    llvm::function_ref<APInt(const APSInt &, const APSInt &)> Fn) {
@ -5858,6 +5900,33 @@ bool InterpretBuiltin(InterpState &S, CodePtr OpPC, const CallExpr *Call,
          return llvm::minimum(A, B);
        });

+  case clang::X86::BI__builtin_ia32_minss:
+  case clang::X86::BI__builtin_ia32_minsd:
+    return interp__builtin_elementwise_fp_binop(
+        S, OpPC, Call,
+        [](const APFloat &A, const APFloat &B,
+           std::optional<APSInt> RoundingMode) -> std::optional<APFloat> {
+          return EvalScalarMinMaxFp(A, B, RoundingMode, /*IsMin=*/true);
+        },
+        /*IsScalar=*/true);
+
+  case clang::X86::BI__builtin_ia32_minsd_round_mask:
+  case clang::X86::BI__builtin_ia32_minss_round_mask:
+  case clang::X86::BI__builtin_ia32_minsh_round_mask:
+  case clang::X86::BI__builtin_ia32_maxsd_round_mask:
+  case clang::X86::BI__builtin_ia32_maxss_round_mask:
+  case clang::X86::BI__builtin_ia32_maxsh_round_mask: {
+    bool IsMin = BuiltinID == clang::X86::BI__builtin_ia32_minsd_round_mask ||
+                 BuiltinID == clang::X86::BI__builtin_ia32_minss_round_mask ||
+                 BuiltinID == clang::X86::BI__builtin_ia32_minsh_round_mask;
+    return interp__builtin_scalar_fp_round_mask_binop(
+        S, OpPC, Call,
+        [IsMin](const APFloat &A, const APFloat &B,
+                std::optional<APSInt> RoundingMode) -> std::optional<APFloat> {
+          return EvalScalarMinMaxFp(A, B, RoundingMode, IsMin);
+        });
+  }
+
  case clang::X86::BI__builtin_ia32_maxps:
  case clang::X86::BI__builtin_ia32_maxpd:
  case clang::X86::BI__builtin_ia32_maxph128:
@ -5879,6 +5948,16 @@ bool InterpretBuiltin(InterpState &S, CodePtr OpPC, const CallExpr *Call,
          return llvm::maximum(A, B);
        });

+  case clang::X86::BI__builtin_ia32_maxss:
+  case clang::X86::BI__builtin_ia32_maxsd:
+    return interp__builtin_elementwise_fp_binop(
+        S, OpPC, Call,
+        [](const APFloat &A, const APFloat &B,
+           std::optional<APSInt> RoundingMode) -> std::optional<APFloat> {
+          return EvalScalarMinMaxFp(A, B, RoundingMode, /*IsMin=*/false);
+        },
+        /*IsScalar=*/true);
+
  default:
    S.FFDiag(S.Current->getLocation(OpPC),
             diag::note_invalid_subexpr_in_const_expr)
--- a/clang/lib/AST/ExprConstShared.h
+++ b/clang/lib/AST/ExprConstShared.h
@ -16,6 +16,7 @@

 #include "clang/Basic/TypeTraits.h"
 #include <cstdint>
+#include <optional>

 namespace llvm {
 class APFloat;
@ -84,4 +85,8 @@ uint8_t GFNIAffine(uint8_t XByte, const llvm::APInt &AQword,
 llvm::APSInt NormalizeRotateAmount(const llvm::APSInt &Value,
                                   const llvm::APSInt &Amount);

+std::optional<llvm::APFloat>
+EvalScalarMinMaxFp(const llvm::APFloat &A, const llvm::APFloat &B,
+                   std::optional<llvm::APSInt> RoundingMode, bool IsMin);
+
 #endif
--- a/clang/lib/AST/ExprConstant.cpp
+++ b/clang/lib/AST/ExprConstant.cpp
@ -12138,6 +12138,20 @@ static bool evalShiftWithCount(
  return true;
 }

+std::optional<APFloat> EvalScalarMinMaxFp(const APFloat &A, const APFloat &B,
+                                          std::optional<APSInt> RoundingMode,
+                                          bool IsMin) {
+  APSInt DefaultMode(APInt(32, 4), /*isUnsigned=*/true);
+  if (RoundingMode.value_or(DefaultMode) != 4)
+    return std::nullopt;
+  if (A.isNaN() || A.isInfinity() || A.isDenormal() || B.isNaN() ||
+      B.isInfinity() || B.isDenormal())
+    return std::nullopt;
+  if (A.isZero() && B.isZero())
+    return B;
+  return IsMin ? llvm::minimum(A, B) : llvm::maximum(A, B);
+}
+
 bool VectorExprEvaluator::VisitCallExpr(const CallExpr *E) {
  if (!IsConstantEvaluatedBuiltinCall(E))
    return ExprEvaluatorBaseTy::VisitCallExpr(E);
@ -12177,7 +12191,8 @@ bool VectorExprEvaluator::VisitCallExpr(const CallExpr *E) {
  auto EvaluateFpBinOpExpr =
      [&](llvm::function_ref<std::optional<APFloat>(
              const APFloat &, const APFloat &, std::optional<APSInt>)>
-              Fn) {
+              Fn,
+          bool IsScalar = false) {
        assert(E->getNumArgs() == 2 || E->getNumArgs() == 3);
        APValue A, B;
        if (!EvaluateAsRValue(Info, E->getArg(0), A) ||
@ -12200,6 +12215,10 @@ bool VectorExprEvaluator::VisitCallExpr(const CallExpr *E) {
        ResultElements.reserve(NumElems);

        for (unsigned EltNum = 0; EltNum < NumElems; ++EltNum) {
+          if (IsScalar && EltNum > 0) {
+            ResultElements.push_back(A.getVectorElt(EltNum));
+            continue;
+          }
          const APFloat &EltA = A.getVectorElt(EltNum).getFloat();
          const APFloat &EltB = B.getVectorElt(EltNum).getFloat();
          std::optional<APFloat> Result = Fn(EltA, EltB, RoundingMode);
@ -12210,6 +12229,42 @@ bool VectorExprEvaluator::VisitCallExpr(const CallExpr *E) {
        return Success(APValue(ResultElements.data(), NumElems), E);
      };

+  auto EvaluateScalarFpRoundMaskBinOp =
+      [&](llvm::function_ref<std::optional<APFloat>(
+              const APFloat &, const APFloat &, std::optional<APSInt>)>
+              Fn) {
+        assert(E->getNumArgs() == 5);
+        APValue VecA, VecB, VecSrc;
+        APSInt MaskVal, Rounding;
+
+        if (!EvaluateAsRValue(Info, E->getArg(0), VecA) ||
+            !EvaluateAsRValue(Info, E->getArg(1), VecB) ||
+            !EvaluateAsRValue(Info, E->getArg(2), VecSrc) ||
+            !EvaluateInteger(E->getArg(3), MaskVal, Info) ||
+            !EvaluateInteger(E->getArg(4), Rounding, Info))
+          return false;
+
+        unsigned NumElems = VecA.getVectorLength();
+        SmallVector<APValue, 8> ResultElements;
+        ResultElements.reserve(NumElems);
+
+        if (MaskVal.getZExtValue() & 1) {
+          const APFloat &EltA = VecA.getVectorElt(0).getFloat();
+          const APFloat &EltB = VecB.getVectorElt(0).getFloat();
+          std::optional<APFloat> Result = Fn(EltA, EltB, Rounding);
+          if (!Result)
+            return false;
+          ResultElements.push_back(APValue(*Result));
+        } else {
+          ResultElements.push_back(VecSrc.getVectorElt(0));
+        }
+
+        for (unsigned I = 1; I < NumElems; ++I)
+          ResultElements.push_back(VecA.getVectorElt(I));
+
+        return Success(APValue(ResultElements.data(), NumElems), E);
+      };
+
  auto EvalSelectScalar = [&](unsigned Len) -> bool {
    APSInt Mask;
    APValue AVal, WVal;
@ -14293,6 +14348,34 @@ bool VectorExprEvaluator::VisitCallExpr(const CallExpr *E) {
          return llvm::minimum(A, B);
        });

+  case clang::X86::BI__builtin_ia32_minss:
+  case clang::X86::BI__builtin_ia32_minsd:
+    return EvaluateFpBinOpExpr(
+        [](const APFloat &A, const APFloat &B,
+           std::optional<APSInt> RoundingMode) -> std::optional<APFloat> {
+          return EvalScalarMinMaxFp(A, B, RoundingMode, /*IsMin=*/true);
+        },
+        /*IsScalar=*/true);
+
+  case clang::X86::BI__builtin_ia32_minsd_round_mask:
+  case clang::X86::BI__builtin_ia32_minss_round_mask:
+  case clang::X86::BI__builtin_ia32_minsh_round_mask:
+  case clang::X86::BI__builtin_ia32_maxsd_round_mask:
+  case clang::X86::BI__builtin_ia32_maxss_round_mask:
+  case clang::X86::BI__builtin_ia32_maxsh_round_mask: {
+    bool IsMin =
+        E->getBuiltinCallee() ==
+            clang::X86::BI__builtin_ia32_minsd_round_mask ||
+        E->getBuiltinCallee() ==
+            clang::X86::BI__builtin_ia32_minss_round_mask ||
+        E->getBuiltinCallee() == clang::X86::BI__builtin_ia32_minsh_round_mask;
+    return EvaluateScalarFpRoundMaskBinOp(
+        [IsMin](const APFloat &A, const APFloat &B,
+                std::optional<APSInt> RoundingMode) -> std::optional<APFloat> {
+          return EvalScalarMinMaxFp(A, B, RoundingMode, IsMin);
+        });
+  }
+
  case clang::X86::BI__builtin_ia32_maxps:
  case clang::X86::BI__builtin_ia32_maxpd:
  case clang::X86::BI__builtin_ia32_maxps256:
@ -14313,6 +14396,15 @@ bool VectorExprEvaluator::VisitCallExpr(const CallExpr *E) {
          return llvm::maximum(A, B);
        });

+  case clang::X86::BI__builtin_ia32_maxss:
+  case clang::X86::BI__builtin_ia32_maxsd:
+    return EvaluateFpBinOpExpr(
+        [](const APFloat &A, const APFloat &B,
+           std::optional<APSInt> RoundingMode) -> std::optional<APFloat> {
+          return EvalScalarMinMaxFp(A, B, RoundingMode, /*IsMin=*/false);
+        },
+        /*IsScalar=*/true);
+
  case clang::X86::BI__builtin_ia32_vcvtps2ph:
  case clang::X86::BI__builtin_ia32_vcvtps2ph256: {
    APValue SrcVec;
--- a/clang/lib/Headers/avx512fintrin.h
+++ b/clang/lib/Headers/avx512fintrin.h
@ -986,10 +986,8 @@ _mm512_maskz_max_ps(__mmask16 __U, __m512 __A, __m512 __B) {
                                             (__v16sf)_mm512_setzero_ps());
 }

-static __inline__ __m128 __DEFAULT_FN_ATTRS128 _mm_mask_max_ss(__m128 __W,
-                                                               __mmask8 __U,
-                                                               __m128 __A,
-                                                               __m128 __B) {
+static __inline__ __m128 __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_mask_max_ss(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
  return (__m128) __builtin_ia32_maxss_round_mask ((__v4sf) __A,
                (__v4sf) __B,
                (__v4sf) __W,
@ -997,9 +995,8 @@ static __inline__ __m128 __DEFAULT_FN_ATTRS128 _mm_mask_max_ss(__m128 __W,
                _MM_FROUND_CUR_DIRECTION);
 }

-static __inline__ __m128 __DEFAULT_FN_ATTRS128 _mm_maskz_max_ss(__mmask8 __U,
-                                                                __m128 __A,
-                                                                __m128 __B) {
+static __inline__ __m128 __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_maskz_max_ss(__mmask8 __U, __m128 __A, __m128 __B) {
  return (__m128) __builtin_ia32_maxss_round_mask ((__v4sf) __A,
                (__v4sf) __B,
                (__v4sf)  _mm_setzero_ps (),
@ -1025,10 +1022,8 @@ static __inline__ __m128 __DEFAULT_FN_ATTRS128 _mm_maskz_max_ss(__mmask8 __U,
                                           (__v4sf)_mm_setzero_ps(), \
                                           (__mmask8)(U), (int)(R)))

-static __inline__ __m128d __DEFAULT_FN_ATTRS128 _mm_mask_max_sd(__m128d __W,
-                                                                __mmask8 __U,
-                                                                __m128d __A,
-                                                                __m128d __B) {
+static __inline__ __m128d __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_mask_max_sd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
  return (__m128d) __builtin_ia32_maxsd_round_mask ((__v2df) __A,
                (__v2df) __B,
                (__v2df) __W,
@ -1036,9 +1031,8 @@ static __inline__ __m128d __DEFAULT_FN_ATTRS128 _mm_mask_max_sd(__m128d __W,
                _MM_FROUND_CUR_DIRECTION);
 }

-static __inline__ __m128d __DEFAULT_FN_ATTRS128 _mm_maskz_max_sd(__mmask8 __U,
-                                                                 __m128d __A,
-                                                                 __m128d __B) {
+static __inline__ __m128d __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_maskz_max_sd(__mmask8 __U, __m128d __A, __m128d __B) {
  return (__m128d) __builtin_ia32_maxsd_round_mask ((__v2df) __A,
                (__v2df) __B,
                (__v2df)  _mm_setzero_pd (),
@ -1208,10 +1202,8 @@ _mm512_maskz_min_ps(__mmask16 __U, __m512 __A, __m512 __B) {
                                             (__v16sf)_mm512_setzero_ps());
 }

-static __inline__ __m128 __DEFAULT_FN_ATTRS128 _mm_mask_min_ss(__m128 __W,
-                                                               __mmask8 __U,
-                                                               __m128 __A,
-                                                               __m128 __B) {
+static __inline__ __m128 __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_mask_min_ss(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
  return (__m128) __builtin_ia32_minss_round_mask ((__v4sf) __A,
                (__v4sf) __B,
                (__v4sf) __W,
@ -1219,9 +1211,8 @@ static __inline__ __m128 __DEFAULT_FN_ATTRS128 _mm_mask_min_ss(__m128 __W,
                _MM_FROUND_CUR_DIRECTION);
 }

-static __inline__ __m128 __DEFAULT_FN_ATTRS128 _mm_maskz_min_ss(__mmask8 __U,
-                                                                __m128 __A,
-                                                                __m128 __B) {
+static __inline__ __m128 __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_maskz_min_ss(__mmask8 __U, __m128 __A, __m128 __B) {
  return (__m128) __builtin_ia32_minss_round_mask ((__v4sf) __A,
                (__v4sf) __B,
                (__v4sf)  _mm_setzero_ps (),
@ -1247,10 +1238,8 @@ static __inline__ __m128 __DEFAULT_FN_ATTRS128 _mm_maskz_min_ss(__mmask8 __U,
                                           (__v4sf)_mm_setzero_ps(), \
                                           (__mmask8)(U), (int)(R)))

-static __inline__ __m128d __DEFAULT_FN_ATTRS128 _mm_mask_min_sd(__m128d __W,
-                                                                __mmask8 __U,
-                                                                __m128d __A,
-                                                                __m128d __B) {
+static __inline__ __m128d __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_mask_min_sd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
  return (__m128d) __builtin_ia32_minsd_round_mask ((__v2df) __A,
                (__v2df) __B,
                (__v2df) __W,
@ -1258,9 +1247,8 @@ static __inline__ __m128d __DEFAULT_FN_ATTRS128 _mm_mask_min_sd(__m128d __W,
                _MM_FROUND_CUR_DIRECTION);
 }

-static __inline__ __m128d __DEFAULT_FN_ATTRS128 _mm_maskz_min_sd(__mmask8 __U,
-                                                                 __m128d __A,
-                                                                 __m128d __B) {
+static __inline__ __m128d __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_maskz_min_sd(__mmask8 __U, __m128d __A, __m128d __B) {
  return (__m128d) __builtin_ia32_minsd_round_mask ((__v2df) __A,
                (__v2df) __B,
                (__v2df)  _mm_setzero_pd (),
--- a/clang/lib/Headers/avx512fp16intrin.h
+++ b/clang/lib/Headers/avx512fp16intrin.h
@ -720,25 +720,22 @@ _mm_maskz_div_sh(__mmask8 __U, __m128h __A, __m128h __B) {
      (__v8hf)(__m128h)(A), (__v8hf)(__m128h)(B), (__v8hf)_mm_setzero_ph(),    \
      (__mmask8)(U), (int)(R)))

-static __inline__ __m128h __DEFAULT_FN_ATTRS128 _mm_min_sh(__m128h __A,
-                                                           __m128h __B) {
+static __inline__ __m128h
+    __DEFAULT_FN_ATTRS128_CONSTEXPR _mm_min_sh(__m128h __A, __m128h __B) {
  return (__m128h)__builtin_ia32_minsh_round_mask(
      (__v8hf)__A, (__v8hf)__B, (__v8hf)_mm_setzero_ph(), (__mmask8)-1,
      _MM_FROUND_CUR_DIRECTION);
 }

-static __inline__ __m128h __DEFAULT_FN_ATTRS128 _mm_mask_min_sh(__m128h __W,
-                                                                __mmask8 __U,
-                                                                __m128h __A,
-                                                                __m128h __B) {
+static __inline__ __m128h __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_mask_min_sh(__m128h __W, __mmask8 __U, __m128h __A, __m128h __B) {
  return (__m128h)__builtin_ia32_minsh_round_mask((__v8hf)__A, (__v8hf)__B,
                                                  (__v8hf)__W, (__mmask8)__U,
                                                  _MM_FROUND_CUR_DIRECTION);
 }

-static __inline__ __m128h __DEFAULT_FN_ATTRS128 _mm_maskz_min_sh(__mmask8 __U,
-                                                                 __m128h __A,
-                                                                 __m128h __B) {
+static __inline__ __m128h __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_maskz_min_sh(__mmask8 __U, __m128h __A, __m128h __B) {
  return (__m128h)__builtin_ia32_minsh_round_mask(
      (__v8hf)__A, (__v8hf)__B, (__v8hf)_mm_setzero_ph(), (__mmask8)__U,
      _MM_FROUND_CUR_DIRECTION);
@ -759,25 +756,22 @@ static __inline__ __m128h __DEFAULT_FN_ATTRS128 _mm_maskz_min_sh(__mmask8 __U,
      (__v8hf)(__m128h)(A), (__v8hf)(__m128h)(B), (__v8hf)_mm_setzero_ph(),    \
      (__mmask8)(U), (int)(R)))

-static __inline__ __m128h __DEFAULT_FN_ATTRS128 _mm_max_sh(__m128h __A,
-                                                           __m128h __B) {
+static __inline__ __m128h
+    __DEFAULT_FN_ATTRS128_CONSTEXPR _mm_max_sh(__m128h __A, __m128h __B) {
  return (__m128h)__builtin_ia32_maxsh_round_mask(
      (__v8hf)__A, (__v8hf)__B, (__v8hf)_mm_setzero_ph(), (__mmask8)-1,
      _MM_FROUND_CUR_DIRECTION);
 }

-static __inline__ __m128h __DEFAULT_FN_ATTRS128 _mm_mask_max_sh(__m128h __W,
-                                                                __mmask8 __U,
-                                                                __m128h __A,
-                                                                __m128h __B) {
+static __inline__ __m128h __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_mask_max_sh(__m128h __W, __mmask8 __U, __m128h __A, __m128h __B) {
  return (__m128h)__builtin_ia32_maxsh_round_mask((__v8hf)__A, (__v8hf)__B,
                                                  (__v8hf)__W, (__mmask8)__U,
                                                  _MM_FROUND_CUR_DIRECTION);
 }

-static __inline__ __m128h __DEFAULT_FN_ATTRS128 _mm_maskz_max_sh(__mmask8 __U,
-                                                                 __m128h __A,
-                                                                 __m128h __B) {
+static __inline__ __m128h __DEFAULT_FN_ATTRS128_CONSTEXPR
+_mm_maskz_max_sh(__mmask8 __U, __m128h __A, __m128h __B) {
  return (__m128h)__builtin_ia32_maxsh_round_mask(
      (__v8hf)__A, (__v8hf)__B, (__v8hf)_mm_setzero_ph(), (__mmask8)__U,
      _MM_FROUND_CUR_DIRECTION);
--- a/clang/lib/Headers/emmintrin.h
+++ b/clang/lib/Headers/emmintrin.h
@ -279,8 +279,8 @@ static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_sqrt_pd(__m128d __a) {
 /// \returns A 128-bit vector of [2 x double] whose lower 64 bits contain the
 ///    minimum value between both operands. The upper 64 bits are copied from
 ///    the upper 64 bits of the first source operand.
-static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_min_sd(__m128d __a,
-                                                        __m128d __b) {
+static __inline__ __m128d __DEFAULT_FN_ATTRS_CONSTEXPR _mm_min_sd(__m128d __a,
+                                                                  __m128d __b) {
  return __builtin_ia32_minsd((__v2df)__a, (__v2df)__b);
 }

@ -325,8 +325,8 @@ static __inline__ __m128d __DEFAULT_FN_ATTRS_CONSTEXPR _mm_min_pd(__m128d __a,
 /// \returns A 128-bit vector of [2 x double] whose lower 64 bits contain the
 ///    maximum value between both operands. The upper 64 bits are copied from
 ///    the upper 64 bits of the first source operand.
-static __inline__ __m128d __DEFAULT_FN_ATTRS _mm_max_sd(__m128d __a,
-                                                        __m128d __b) {
+static __inline__ __m128d __DEFAULT_FN_ATTRS_CONSTEXPR _mm_max_sd(__m128d __a,
+                                                                  __m128d __b) {
  return __builtin_ia32_maxsd((__v2df)__a, (__v2df)__b);
 }

--- a/clang/lib/Headers/xmmintrin.h
+++ b/clang/lib/Headers/xmmintrin.h
@ -341,7 +341,8 @@ _mm_rsqrt_ps(__m128 __a)
 /// \returns A 128-bit vector of [4 x float] whose lower 32 bits contain the
 ///    minimum value between both operands. The upper 96 bits are copied from
 ///    the upper 96 bits of the first source operand.
-static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_min_ss(__m128 __a, __m128 __b) {
+static __inline__ __m128 __DEFAULT_FN_ATTRS_CONSTEXPR _mm_min_ss(__m128 __a,
+                                                                 __m128 __b) {
  return __builtin_ia32_minss((__v4sf)__a, (__v4sf)__b);
 }

@ -384,7 +385,8 @@ static __inline__ __m128 __DEFAULT_FN_ATTRS_CONSTEXPR _mm_min_ps(__m128 __a,
 /// \returns A 128-bit vector of [4 x float] whose lower 32 bits contain the
 ///    maximum value between both operands. The upper 96 bits are copied from
 ///    the upper 96 bits of the first source operand.
-static __inline__ __m128 __DEFAULT_FN_ATTRS _mm_max_ss(__m128 __a, __m128 __b) {
+static __inline__ __m128 __DEFAULT_FN_ATTRS_CONSTEXPR _mm_max_ss(__m128 __a,
+                                                                 __m128 __b) {
  return __builtin_ia32_maxss((__v4sf)__a, (__v4sf)__b);
 }

--- a/clang/test/CodeGen/X86/avx512f-builtins.c
+++ b/clang/test/CodeGen/X86/avx512f-builtins.c
@ -3965,13 +3965,17 @@ __m128 test_mm_maskz_max_round_ss(__mmask8 __U, __m128 __A, __m128 __B) {
 __m128 test_mm_mask_max_ss(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
  // CHECK-LABEL: test_mm_mask_max_ss
  // CHECK: @llvm.x86.avx512.mask.max.ss.round
-  return _mm_mask_max_ss(__W,__U,__A,__B); 
+  return _mm_mask_max_ss(__W,__U,__A,__B);
 }
+TEST_CONSTEXPR(match_m128(_mm_mask_max_ss((__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f}, 0x1, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f}), 100.0f, 20.0f, 30.0f, 40.0f));
+
 __m128 test_mm_maskz_max_ss(__mmask8 __U, __m128 __A, __m128 __B) {
  // CHECK-LABEL: test_mm_maskz_max_ss
  // CHECK: @llvm.x86.avx512.mask.max.ss.round
-  return _mm_maskz_max_ss(__U,__A,__B); 
+  return _mm_maskz_max_ss(__U,__A,__B);
 }
+TEST_CONSTEXPR(match_m128(_mm_maskz_max_ss(0x1, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f}), 100.0f, 20.0f, 30.0f, 40.0f));
+
 __m128d test_mm_max_round_sd(__m128d __A, __m128d __B) {
  // CHECK-LABEL: test_mm_max_round_sd
  // CHECK: @llvm.x86.avx512.mask.max.sd.round
@ -3990,13 +3994,17 @@ __m128d test_mm_maskz_max_round_sd(__mmask8 __U, __m128d __A, __m128d __B) {
 __m128d test_mm_mask_max_sd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
  // CHECK-LABEL: test_mm_mask_max_sd
  // CHECK: @llvm.x86.avx512.mask.max.sd.round
-  return _mm_mask_max_sd(__W,__U,__A,__B); 
+  return _mm_mask_max_sd(__W,__U,__A,__B);
 }
+TEST_CONSTEXPR(match_m128d(_mm_mask_max_sd((__m128d)(__v2df){1.0, 2.0}, 0x1, (__m128d)(__v2df){10.0, 20.0}, (__m128d)(__v2df){100.0, 200.0}), 100.0, 20.0));
+
 __m128d test_mm_maskz_max_sd(__mmask8 __U, __m128d __A, __m128d __B) {
  // CHECK-LABEL: test_mm_maskz_max_sd
  // CHECK: @llvm.x86.avx512.mask.max.sd.round
-  return _mm_maskz_max_sd(__U,__A,__B); 
+  return _mm_maskz_max_sd(__U,__A,__B);
 }
+TEST_CONSTEXPR(match_m128d(_mm_maskz_max_sd(0x1, (__m128d)(__v2df){10.0, 20.0}, (__m128d)(__v2df){100.0, 200.0}), 100.0, 20.0));
+
 __m128 test_mm_min_round_ss(__m128 __A, __m128 __B) {
  // CHECK-LABEL: test_mm_min_round_ss
  // CHECK: @llvm.x86.avx512.mask.min.ss.round
@ -4015,13 +4023,17 @@ __m128 test_mm_maskz_min_round_ss(__mmask8 __U, __m128 __A, __m128 __B) {
 __m128 test_mm_mask_min_ss(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
  // CHECK-LABEL: test_mm_mask_min_ss
  // CHECK: @llvm.x86.avx512.mask.min.ss.round
-  return _mm_mask_min_ss(__W,__U,__A,__B); 
+  return _mm_mask_min_ss(__W,__U,__A,__B);
 }
+TEST_CONSTEXPR(match_m128(_mm_mask_min_ss((__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f}, 0x1, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f}), 10.0f, 20.0f, 30.0f, 40.0f));
+
 __m128 test_mm_maskz_min_ss(__mmask8 __U, __m128 __A, __m128 __B) {
  // CHECK-LABEL: test_mm_maskz_min_ss
  // CHECK: @llvm.x86.avx512.mask.min.ss.round
-  return _mm_maskz_min_ss(__U,__A,__B); 
+  return _mm_maskz_min_ss(__U,__A,__B);
 }
+TEST_CONSTEXPR(match_m128(_mm_maskz_min_ss(0x1, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f}), 10.0f, 20.0f, 30.0f, 40.0f));
+
 __m128d test_mm_min_round_sd(__m128d __A, __m128d __B) {
  // CHECK-LABEL: test_mm_min_round_sd
  // CHECK: @llvm.x86.avx512.mask.min.sd.round
@ -4040,13 +4052,16 @@ __m128d test_mm_maskz_min_round_sd(__mmask8 __U, __m128d __A, __m128d __B) {
 __m128d test_mm_mask_min_sd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
  // CHECK-LABEL: test_mm_mask_min_sd
  // CHECK: @llvm.x86.avx512.mask.min.sd.round
-  return _mm_mask_min_sd(__W,__U,__A,__B); 
+  return _mm_mask_min_sd(__W,__U,__A,__B);
 }
+TEST_CONSTEXPR(match_m128d(_mm_mask_min_sd((__m128d)(__v2df){1.0, 2.0}, 0x1, (__m128d)(__v2df){10.0, 20.0}, (__m128d)(__v2df){100.0, 200.0}), 10.0, 20.0));
+
 __m128d test_mm_maskz_min_sd(__mmask8 __U, __m128d __A, __m128d __B) {
  // CHECK-LABEL: test_mm_maskz_min_sd
  // CHECK: @llvm.x86.avx512.mask.min.sd.round
-  return _mm_maskz_min_sd(__U,__A,__B); 
+  return _mm_maskz_min_sd(__U,__A,__B);
 }
+TEST_CONSTEXPR(match_m128d(_mm_maskz_min_sd(0x1, (__m128d)(__v2df){10.0, 20.0}, (__m128d)(__v2df){100.0, 200.0}), 10.0, 20.0));

 __m512 test_mm512_undefined(void) {
  // CHECK-LABEL: test_mm512_undefined
--- a/clang/test/CodeGen/X86/avx512fp16-builtins.c
+++ b/clang/test/CodeGen/X86/avx512fp16-builtins.c
@ -1037,17 +1037,24 @@ __m128h test_mm_mask_min_sh(__m128h __W, __mmask8 __U, __m128h __A, __m128h __B)
  // CHECK: @llvm.x86.avx512fp16.mask.min.sh.round
  return _mm_mask_min_sh(__W, __U, __A, __B);
 }
+TEST_CONSTEXPR(match_m128h(_mm_mask_min_sh((__m128h)(__v8hf){1.0f,2.0f,3.0f,4.0f,5.0f,6.0f,7.0f,8.0f},(__mmask8)0x01,(__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));
+TEST_CONSTEXPR(match_m128h(_mm_mask_min_sh((__m128h)(__v8hf){1.0f,2.0f,3.0f,4.0f,5.0f,6.0f,7.0f,8.0f},(__mmask8)0x00,(__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),1.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));
+
 __m128h test_mm_maskz_min_sh(__mmask8 __U, __m128h __A, __m128h __B) {
  // CHECK-LABEL: test_mm_maskz_min_sh
  // CHECK: @llvm.x86.avx512fp16.mask.min.sh.round
  return _mm_maskz_min_sh(__U, __A, __B);
 }
+TEST_CONSTEXPR(match_m128h(_mm_maskz_min_sh((__mmask8)0x01,(__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));
+TEST_CONSTEXPR(match_m128h(_mm_maskz_min_sh((__mmask8)0x00,(__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),0.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));

 __m128h test_mm_min_sh(__m128h __A, __m128h __B) {
  // CHECK-LABEL: test_mm_min_sh
  // CHECK: @llvm.x86.avx512fp16.mask.min.sh.round
  return _mm_min_sh(__A, __B);
 }
+TEST_CONSTEXPR(match_m128h(_mm_min_sh((__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));
+TEST_CONSTEXPR(match_m128h(_mm_min_sh((__m128h)(__v8hf){+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f},(__m128h)(__v8hf){-0.0f,-0.0f,-0.0f,-0.0f,-0.0f,-0.0f,-0.0f,-0.0f}),-0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f));

 __m128h test_mm_max_round_sh(__m128h __A, __m128h __B) {
  // CHECK-LABEL: test_mm_max_round_sh
@ -1069,17 +1076,25 @@ __m128h test_mm_mask_max_sh(__m128h __W, __mmask8 __U, __m128h __A, __m128h __B)
  // CHECK: @llvm.x86.avx512fp16.mask.max.sh.round
  return _mm_mask_max_sh(__W, __U, __A, __B);
 }
+TEST_CONSTEXPR(match_m128h(_mm_mask_max_sh((__m128h)(__v8hf){1.0f,2.0f,3.0f,4.0f,5.0f,6.0f,7.0f,8.0f},(__mmask8)0x01,(__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),100.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));
+TEST_CONSTEXPR(match_m128h(_mm_mask_max_sh((__m128h)(__v8hf){1.0f,2.0f,3.0f,4.0f,5.0f,6.0f,7.0f,8.0f},(__mmask8)0x00,(__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),1.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));
+
 __m128h test_mm_maskz_max_sh(__mmask8 __U, __m128h __A, __m128h __B) {
  // CHECK-LABEL: test_mm_maskz_max_sh
  // CHECK: @llvm.x86.avx512fp16.mask.max.sh.round
  return _mm_maskz_max_sh(__U, __A, __B);
 }
+TEST_CONSTEXPR(match_m128h(_mm_maskz_max_sh((__mmask8)0x01,(__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),100.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));
+TEST_CONSTEXPR(match_m128h(_mm_maskz_max_sh((__mmask8)0x00,(__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),0.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));

 __m128h test_mm_max_sh(__m128h __A, __m128h __B) {
  // CHECK-LABEL: test_mm_max_sh
  // CHECK: @llvm.x86.avx512fp16.mask.max.sh.round
  return _mm_max_sh(__A, __B);
 }
+TEST_CONSTEXPR(match_m128h(_mm_max_sh((__m128h)(__v8hf){10.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f},(__m128h)(__v8hf){100.0f,200.0f,300.0f,400.0f,500.0f,600.0f,700.0f,800.0f}),100.0f,20.0f,30.0f,40.0f,50.0f,60.0f,70.0f,80.0f));
+TEST_CONSTEXPR(match_m128h(_mm_max_sh((__m128h)(__v8hf){+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f},(__m128h)(__v8hf){-0.0f,-0.0f,-0.0f,-0.0f,-0.0f,-0.0f,-0.0f,-0.0f}),-0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f,+0.0f));
+
 __mmask32 test_mm512_cmp_round_ph_mask(__m512h a, __m512h b) {
  // CHECK-LABEL: test_mm512_cmp_round_ph_mask
  // CHECK: fcmp oeq <32 x half> %{{.*}}, %{{.*}}
--- a/clang/test/CodeGen/X86/sse-builtins.c
+++ b/clang/test/CodeGen/X86/sse-builtins.c
@ -524,6 +524,8 @@ __m128 test_mm_max_ss(__m128 A, __m128 B) {
  // CHECK: @llvm.x86.sse.max.ss(<4 x float> %{{.*}}, <4 x float> %{{.*}})
  return _mm_max_ss(A, B);
 }
+TEST_CONSTEXPR(match_m128(_mm_max_ss((__m128){+1.0f, +2.0f, +3.0f, +4.0f}, (__m128){+4.0f, +3.0f, +2.0f, +1.0f}), +4.0f, +2.0f, +3.0f, +4.0f));
+TEST_CONSTEXPR(match_m128(_mm_max_ss((__m128){+0.0f, -0.0f, +0.0f, -0.0f}, (__m128){-0.0f, +0.0f, -0.0f, +0.0f}), -0.0f, -0.0f, +0.0f, -0.0f));

 __m128 test_mm_min_ps(__m128 A, __m128 B) {
  // CHECK-LABEL: test_mm_min_ps
@ -539,6 +541,8 @@ __m128 test_mm_min_ss(__m128 A, __m128 B) {
  // CHECK: @llvm.x86.sse.min.ss(<4 x float> %{{.*}}, <4 x float> %{{.*}})
  return _mm_min_ss(A, B);
 }
+TEST_CONSTEXPR(match_m128(_mm_min_ss((__m128){+1.0f, +2.0f, +3.0f, +4.0f}, (__m128){+4.0f, +3.0f, +2.0f, +1.0f}), +1.0f, +2.0f, +3.0f, +4.0f));
+TEST_CONSTEXPR(match_m128(_mm_min_ss((__m128){+0.0f, -0.0f, +0.0f, -0.0f}, (__m128){-0.0f, +0.0f, -0.0f, +0.0f}), -0.0f, -0.0f, +0.0f, -0.0f));

 __m128 test_mm_move_ss(__m128 A, __m128 B) {
  // CHECK-LABEL: test_mm_move_ss
--- a/clang/test/CodeGen/X86/sse2-builtins.c
+++ b/clang/test/CodeGen/X86/sse2-builtins.c
@ -894,6 +894,8 @@ __m128d test_mm_max_sd(__m128d A, __m128d B) {
  // CHECK: call {{.*}}<2 x double> @llvm.x86.sse2.max.sd(<2 x double> %{{.*}}, <2 x double> %{{.*}})
  return _mm_max_sd(A, B);
 }
+TEST_CONSTEXPR(match_m128d(_mm_max_sd((__m128d){+1.0, +2.0}, (__m128d){+4.0, +1.0}), +4.0, +2.0));
+TEST_CONSTEXPR(match_m128d(_mm_max_sd((__m128d){+0.0, -0.0}, (__m128d){-0.0, +0.0}), -0.0, -0.0));

 void test_mm_mfence(void) {
  // CHECK-LABEL: test_mm_mfence
@ -931,6 +933,8 @@ __m128d test_mm_min_sd(__m128d A, __m128d B) {
  // CHECK: call {{.*}}<2 x double> @llvm.x86.sse2.min.sd(<2 x double> %{{.*}}, <2 x double> %{{.*}})
  return _mm_min_sd(A, B);
 }
+TEST_CONSTEXPR(match_m128d(_mm_min_sd((__m128d){+1.0, +2.0}, (__m128d){+4.0, +1.0}), +1.0, +2.0));
+TEST_CONSTEXPR(match_m128d(_mm_min_sd((__m128d){+0.0, -0.0}, (__m128d){-0.0, +0.0}), -0.0, -0.0));

 __m64 test_mm_movepi64_pi64(__m128i A) {
  // CHECK-LABEL: test_mm_movepi64_pi64
--- a/clang/test/SemaCXX/constexpr-x86-avx512f-builtins.cpp
+++ b/clang/test/SemaCXX/constexpr-x86-avx512f-builtins.cpp
@ -228,3 +228,518 @@ constexpr __m512 r = _mm512_mask_cvtpd_pslo(src, 0x4, a_nan);
 // expected-note@-4 {{in call to '_mm512_mask_cvtpd_pslo({9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00, 9.000000e+00}, 4, {-1.000000e+00, 2.000000e+00, nan, 8.000000e+00, 1.600000e+01, 3.200000e+01, 6.400000e+01, 1.280000e+02})'}}
 }
 }
+
+constexpr int ROUND_CUR_DIRECTION = 4;
+constexpr int ROUND_NO_EXC = 8;
+
+namespace Test_mm_mask_min_ss_valid {
+constexpr __m128 result = _mm_mask_min_ss((__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f}, 1, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f});
+TEST_CONSTEXPR(match_m128(result, 10.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_mask_max_ss_valid {
+constexpr __m128 result = _mm_mask_max_ss((__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f}, 1, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f});
+TEST_CONSTEXPR(match_m128(result, 100.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_mask_min_sd_valid {
+constexpr __m128d result = _mm_mask_min_sd((__m128d)(__v2df){1.0, 2.0}, 1, (__m128d)(__v2df){10.0, 20.0}, (__m128d)(__v2df){100.0, 200.0});
+TEST_CONSTEXPR(match_m128d(result, 10.0, 20.0));
+}
+
+namespace Test_mm_mask_max_sd_valid {
+constexpr __m128d result = _mm_mask_max_sd((__m128d)(__v2df){1.0, 2.0}, 1, (__m128d)(__v2df){10.0, 20.0}, (__m128d)(__v2df){100.0, 200.0});
+TEST_CONSTEXPR(match_m128d(result, 100.0, 20.0));
+}
+
+namespace Test_mm_mask_min_ss_nan {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_nanf(""), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_min_ss(src, 1, a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_mask_min_ss_pos_inf {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_min_ss(src, 1, a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_mask_min_ss_neg_inf {
+constexpr __m128 a = (__m128)(__v4sf){-__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_min_ss(src, 1, a, b); // expected-error {{must be initialized by a constant expression}}
+}
+namespace Test_mm_maskz_min_ss_valid {
+constexpr __m128 result = _mm_maskz_min_ss(1, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f});
+TEST_CONSTEXPR(match_m128(result, 10.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maskz_max_ss_valid {
+constexpr __m128 result = _mm_maskz_max_ss(1, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f});
+TEST_CONSTEXPR(match_m128(result, 100.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maskz_min_sd_valid {
+constexpr __m128d result = _mm_maskz_min_sd(1, (__m128d)(__v2df){10.0, 20.0}, (__m128d)(__v2df){100.0, 200.0});
+TEST_CONSTEXPR(match_m128d(result, 10.0, 20.0));
+}
+
+namespace Test_mm_maskz_max_sd_valid {
+constexpr __m128d result = _mm_maskz_max_sd(1, (__m128d)(__v2df){10.0, 20.0}, (__m128d)(__v2df){100.0, 200.0});
+TEST_CONSTEXPR(match_m128d(result, 100.0, 20.0));
+}
+
+namespace Test_mm_maskz_min_ss_mask_zero {
+constexpr __m128 result = _mm_maskz_min_ss(0, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f});
+TEST_CONSTEXPR(match_m128(result, 0.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_mask_min_ss_mask_zero {
+constexpr __m128 result = _mm_mask_min_ss((__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f}, 0, (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f}, (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f});
+TEST_CONSTEXPR(match_m128(result, 1.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maskz_min_ss_nan {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_nanf(""), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_maskz_min_ss(1, a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maskz_max_sd_nan {
+constexpr __m128d a = (__m128d)(__v2df){__builtin_nan(""), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_maskz_max_sd(1, a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_mask_max_ss_pos_inf {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_max_ss(src, 1, a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_mask_max_sd_neg_inf {
+constexpr __m128d a = (__m128d)(__v2df){-__builtin_inf(), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = _mm_mask_max_sd(src, 1, a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_minss_round_mask_invalid_rounding_8 {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_minss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxss_round_mask_invalid_rounding_8 {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_maxss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxss_round_mask_invalid_rounding_12 {
+constexpr int ROUND_CUR_DIRECTION_NO_EXC = 12;
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_maxss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_minss_round_mask_valid_rounding {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_minss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 10.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maxss_round_mask_valid_rounding {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_maxss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 100.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_minss_round_mask_mask_zero {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_minss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 0, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 1.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maxss_round_mask_mask_zero {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_maxss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 0, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 1.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_minss_round_mask_nan {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_nanf(""), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_minss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxss_round_mask_nan {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_nanf(""), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_maxss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_minss_round_mask_pos_infinity {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_minss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxss_round_mask_pos_infinity {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_maxss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_minss_round_mask_neg_infinity {
+constexpr __m128 a = (__m128)(__v4sf){-__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_minss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxss_round_mask_neg_infinity {
+constexpr __m128 a = (__m128)(__v4sf){-__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = (__m128)__builtin_ia32_maxss_round_mask((__v4sf)a, (__v4sf)b, (__v4sf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_minsd_round_mask_invalid_rounding_8 {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_minsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxsd_round_mask_invalid_rounding_8 {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_maxsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxsd_round_mask_invalid_rounding_12 {
+constexpr int ROUND_CUR_DIRECTION_NO_EXC = 12;
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_maxsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_minsd_round_mask_valid_rounding {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_minsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 10.0, 20.0));
+}
+
+namespace Test_mm_maxsd_round_mask_valid_rounding {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_maxsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 100.0, 20.0));
+}
+
+namespace Test_mm_minsd_round_mask_mask_zero {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_minsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 0, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 1.0, 20.0));
+}
+
+namespace Test_mm_maxsd_round_mask_mask_zero {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_maxsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 0, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 1.0, 20.0));
+}
+
+namespace Test_mm_minsd_round_mask_nan {
+constexpr __m128d a = (__m128d)(__v2df){__builtin_nan(""), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_minsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxsd_round_mask_nan {
+constexpr __m128d a = (__m128d)(__v2df){__builtin_nan(""), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_maxsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_minsd_round_mask_pos_infinity {
+constexpr __m128d a = (__m128d)(__v2df){__builtin_inf(), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_minsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxsd_round_mask_pos_infinity {
+constexpr __m128d a = (__m128d)(__v2df){__builtin_inf(), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_maxsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_minsd_round_mask_neg_infinity {
+constexpr __m128d a = (__m128d)(__v2df){-__builtin_inf(), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_minsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maxsd_round_mask_neg_infinity {
+constexpr __m128d a = (__m128d)(__v2df){-__builtin_inf(), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = (__m128d)__builtin_ia32_maxsd_round_mask((__v2df)a, (__v2df)b, (__v2df)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_mask_min_round_ss_valid {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_min_round_ss(src, 1, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 10.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maskz_min_round_ss_valid {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_maskz_min_round_ss(1, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 10.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_mask_max_round_ss_valid {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_max_round_ss(src, 1, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 100.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maskz_max_round_ss_valid {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_maskz_max_round_ss(1, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 100.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_mask_min_round_sd_valid {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = _mm_mask_min_round_sd(src, 1, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 10.0, 20.0));
+}
+
+namespace Test_mm_maskz_min_round_sd_valid {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_maskz_min_round_sd(1, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 10.0, 20.0));
+}
+
+namespace Test_mm_mask_max_round_sd_valid {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = _mm_mask_max_round_sd(src, 1, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 100.0, 20.0));
+}
+
+namespace Test_mm_maskz_max_round_sd_valid {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_maskz_max_round_sd(1, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 100.0, 20.0));
+}
+
+namespace Test_mm_mask_min_round_ss_mask_zero {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_min_round_ss(src, 0, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 1.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maskz_min_round_ss_mask_zero {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_maskz_min_round_ss(0, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 0.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_mask_max_round_ss_mask_zero {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_max_round_ss(src, 0, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 1.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_maskz_max_round_ss_mask_zero {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_maskz_max_round_ss(0, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128(result, 0.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_mask_min_round_sd_mask_zero {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = _mm_mask_min_round_sd(src, 0, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 1.0, 20.0));
+}
+
+namespace Test_mm_maskz_min_round_sd_mask_zero {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_maskz_min_round_sd(0, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 0.0, 20.0));
+}
+
+namespace Test_mm_mask_max_round_sd_mask_zero {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = _mm_mask_max_round_sd(src, 0, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 1.0, 20.0));
+}
+
+namespace Test_mm_maskz_max_round_sd_mask_zero {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_maskz_max_round_sd(0, a, b, ROUND_CUR_DIRECTION);
+static_assert(match_m128d(result, 0.0, 20.0));
+}
+
+namespace Test_mm_mask_min_round_ss_invalid_rounding {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_min_round_ss(src, 1, a, b, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maskz_max_round_ss_invalid_rounding {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_maskz_max_round_ss(1, a, b, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_mask_min_round_sd_invalid_rounding {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = _mm_mask_min_round_sd(src, 1, a, b, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maskz_max_round_sd_invalid_rounding {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_maskz_max_round_sd(1, a, b, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_mask_min_round_ss_nan {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_nanf(""), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 src = (__m128)(__v4sf){1.0f, 2.0f, 3.0f, 4.0f};
+constexpr __m128 result = _mm_mask_min_round_ss(src, 1, a, b, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maskz_max_round_ss_inf {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_maskz_max_round_ss(1, a, b, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_mask_max_round_sd_nan {
+constexpr __m128d a = (__m128d)(__v2df){__builtin_nan(""), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d src = (__m128d)(__v2df){1.0, 2.0};
+constexpr __m128d result = _mm_mask_max_round_sd(src, 1, a, b, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_maskz_min_round_sd_inf {
+constexpr __m128d a = (__m128d)(__v2df){-__builtin_inf(), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_maskz_min_round_sd(1, a, b, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_ss_valid {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_min_ss(a, b);
+static_assert(match_m128(result, 10.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_max_ss_valid {
+constexpr __m128 a = (__m128)(__v4sf){10.0f, 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_max_ss(a, b);
+static_assert(match_m128(result, 100.0f, 20.0f, 30.0f, 40.0f));
+}
+
+namespace Test_mm_min_sd_valid {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_min_sd(a, b);
+static_assert(match_m128d(result, 10.0, 20.0));
+}
+
+namespace Test_mm_max_sd_valid {
+constexpr __m128d a = (__m128d)(__v2df){10.0, 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_max_sd(a, b);
+static_assert(match_m128d(result, 100.0, 20.0));
+}
+
+namespace Test_mm_min_ss_nan {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_nanf(""), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_min_ss(a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_max_ss_inf {
+constexpr __m128 a = (__m128)(__v4sf){__builtin_inff(), 20.0f, 30.0f, 40.0f};
+constexpr __m128 b = (__m128)(__v4sf){100.0f, 200.0f, 300.0f, 400.0f};
+constexpr __m128 result = _mm_max_ss(a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sd_nan {
+constexpr __m128d a = (__m128d)(__v2df){__builtin_nan(""), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_min_sd(a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_max_sd_inf {
+constexpr __m128d a = (__m128d)(__v2df){-__builtin_inf(), 20.0};
+constexpr __m128d b = (__m128d)(__v2df){100.0, 200.0};
+constexpr __m128d result = _mm_max_sd(a, b); // expected-error {{must be initialized by a constant expression}}
+}
--- a/clang/test/SemaCXX/constexpr-x86-avx512fp16-builtins.cpp
+++ b/clang/test/SemaCXX/constexpr-x86-avx512fp16-builtins.cpp
@ -0,0 +1,113 @@
+// RUN: %clang_cc1 -std=c++20 -ffreestanding -fexperimental-new-constant-interpreter -triple x86_64-unknown-unknown -target-feature +avx512fp16 -verify %s
+
+#include <immintrin.h>
+#include "../CodeGen/X86/builtin_test_helpers.h"
+
+constexpr int ROUND_CUR_DIRECTION = 4;
+constexpr int ROUND_NO_EXC = 8;
+constexpr int ROUND_CUR_DIRECTION_NO_EXC = 12;
+
+namespace Test_mm_min_sh_round_mask_invalid_rounding {
+constexpr __m128h a = (__m128h)(__v8hf){10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_minsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_max_sh_round_mask_invalid_rounding_8 {
+constexpr __m128h a = (__m128h)(__v8hf){10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_maxsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_max_sh_round_mask_invalid_rounding_12 {
+constexpr __m128h a = (__m128h)(__v8hf){10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_maxsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_CUR_DIRECTION_NO_EXC); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sh_round_mask_valid_rounding {
+constexpr __m128h a = (__m128h)(__v8hf){10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_minsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_CUR_DIRECTION);
+static_assert(match_m128h(result, 10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f));
+}
+
+namespace Test_mm_max_sh_round_mask_valid_rounding {
+constexpr __m128h a = (__m128h)(__v8hf){10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_maxsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_CUR_DIRECTION);
+static_assert(match_m128h(result, 100.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f));
+}
+
+namespace Test_mm_min_sh_round_mask_nan {
+constexpr __m128h a = (__m128h)(__v8hf){__builtin_nanf16(""), 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_minsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sh_round_mask_pos_infinity {
+constexpr __m128h a = (__m128h)(__v8hf){__builtin_inff16(), 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_minsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sh_round_mask_neg_infinity {
+constexpr __m128h a = (__m128h)(__v8hf){-__builtin_inff16(), 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_minsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sh_round_mask_denormal {
+constexpr _Float16 denormal = 0x1.0p-15f16;
+constexpr __m128h a = (__m128h)(__v8hf){denormal, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h src = (__m128h)(__v8hf){1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
+constexpr __m128h result = (__m128h)__builtin_ia32_minsh_round_mask((__v8hf)a, (__v8hf)b, (__v8hf)src, 1, ROUND_CUR_DIRECTION); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sh_valid {
+constexpr __m128h a = (__m128h)(__v8hf){10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h result = _mm_min_sh(a, b);
+static_assert(match_m128h(result, 10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f));
+}
+
+namespace Test_mm_max_sh_valid {
+constexpr __m128h a = (__m128h)(__v8hf){10.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h result = _mm_max_sh(a, b);
+static_assert(match_m128h(result, 100.0f, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f));
+}
+
+namespace Test_mm_min_sh_nan {
+constexpr __m128h a = (__m128h)(__v8hf){__builtin_nanf16(""), 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h result = _mm_min_sh(a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sh_pos_infinity {
+constexpr __m128h a = (__m128h)(__v8hf){__builtin_inff16(), 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h result = _mm_min_sh(a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sh_neg_infinity {
+constexpr __m128h a = (__m128h)(__v8hf){-__builtin_inff16(), 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h result = _mm_min_sh(a, b); // expected-error {{must be initialized by a constant expression}}
+}
+
+namespace Test_mm_min_sh_denormal {
+constexpr _Float16 denormal = 0x1.0p-15f16;
+constexpr __m128h a = (__m128h)(__v8hf){denormal, 20.0f, 30.0f, 40.0f, 50.0f, 60.0f, 70.0f, 80.0f};
+constexpr __m128h b = (__m128h)(__v8hf){100.0f, 200.0f, 300.0f, 400.0f, 500.0f, 600.0f, 700.0f, 800.0f};
+constexpr __m128h result = _mm_min_sh(a, b); // expected-error {{must be initialized by a constant expression}}
+}