[LLD][COFF] Emit tail merge pdata for delay load thunks on ARM64EC (#116810)
[llvm-project.git] / libclc / amdgcn / lib / integer / popcount.inc
blob402ddb768c6a6ff0d8b79859a981d54e59129005
1 _CLC_OVERLOAD _CLC_DEF __CLC_GENTYPE popcount(__CLC_GENTYPE x) {
2 /* LLVM-4+ implements i16 ops for VI+ ASICs. However, ctpop implementation
3  * is missing until r326535. Therefore we have to convert sub i32 types to uint
4  * as a workaround. */
5 #if __clang_major__ < 7 && __clang_major__ > 3 && __CLC_GENSIZE < 32
6         /* Prevent sign extension on uint conversion */
7         const __CLC_U_GENTYPE y = __CLC_XCONCAT(as_, __CLC_U_GENTYPE)(x);
8         /* Convert to uintX */
9         const __CLC_XCONCAT(uint, __CLC_VECSIZE) z = __CLC_XCONCAT(convert_uint, __CLC_VECSIZE)(y);
10         /* Call popcount on uintX type */
11         const __CLC_XCONCAT(uint, __CLC_VECSIZE) res = __clc_native_popcount(z);
12         /* Convert the result back to gentype. */
13         return __CLC_XCONCAT(convert_, __CLC_GENTYPE)(res);
14 #else
15         return __clc_native_popcount(x);
16 #endif