mirror of https://gitee.com/openkylin/qemu.git
target/arm: Implement SVE2 XAR
In addition, use the same vector generator interface for AdvSIMD. This fixes a bug in which the AdvSIMD insn failed to clear the high bits of the SVE register. Reviewed-by: Peter Maydell <peter.maydell@linaro.org> Signed-off-by: Richard Henderson <richard.henderson@linaro.org> Message-id: 20210525010358.152808-44-richard.henderson@linaro.org Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
This commit is contained in:
parent
7d47ac94a7
commit
e6eba6e532
|
@ -2558,6 +2558,10 @@ DEF_HELPER_FLAGS_5(sve2_histcnt_d, TCG_CALL_NO_RWG,
|
|||
|
||||
DEF_HELPER_FLAGS_4(sve2_histseg, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_4(sve2_xar_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(sve2_xar_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(sve2_xar_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_6(sve2_faddp_zpzz_h, TCG_CALL_NO_RWG,
|
||||
void, ptr, ptr, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_6(sve2_faddp_zpzz_s, TCG_CALL_NO_RWG,
|
||||
|
|
|
@ -953,6 +953,8 @@ DEF_HELPER_FLAGS_5(neon_sqrdmulh_h, TCG_CALL_NO_RWG,
|
|||
DEF_HELPER_FLAGS_5(neon_sqrdmulh_s, TCG_CALL_NO_RWG,
|
||||
void, ptr, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_4(gvec_xar_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
#ifdef TARGET_AARCH64
|
||||
#include "helper-a64.h"
|
||||
#include "helper-sve.h"
|
||||
|
|
|
@ -65,6 +65,7 @@
|
|||
&rr_dbm rd rn dbm
|
||||
&rrri rd rn rm imm
|
||||
&rri_esz rd rn imm esz
|
||||
&rrri_esz rd rn rm imm esz
|
||||
&rrr_esz rd rn rm esz
|
||||
&rpr_esz rd pg rn esz
|
||||
&rpr_s rd pg rn s
|
||||
|
@ -384,6 +385,9 @@ ORR_zzz 00000100 01 1 ..... 001 100 ..... ..... @rd_rn_rm_e0
|
|||
EOR_zzz 00000100 10 1 ..... 001 100 ..... ..... @rd_rn_rm_e0
|
||||
BIC_zzz 00000100 11 1 ..... 001 100 ..... ..... @rd_rn_rm_e0
|
||||
|
||||
XAR 00000100 .. 1 ..... 001 101 rm:5 rd:5 &rrri_esz \
|
||||
rn=%reg_movprfx esz=%tszimm16_esz imm=%tszimm16_shr
|
||||
|
||||
# SVE2 bitwise ternary operations
|
||||
EOR3 00000100 00 1 ..... 001 110 ..... ..... @rdn_ra_rm_e0
|
||||
BSL 00000100 00 1 ..... 001 111 ..... ..... @rdn_ra_rm_e0
|
||||
|
|
|
@ -7202,3 +7202,42 @@ void HELPER(sve2_histseg)(void *vd, void *vn, void *vm, uint32_t desc)
|
|||
*(uint64_t *)(vd + i + 8) = out1;
|
||||
}
|
||||
}
|
||||
|
||||
void HELPER(sve2_xar_b)(void *vd, void *vn, void *vm, uint32_t desc)
|
||||
{
|
||||
intptr_t i, opr_sz = simd_oprsz(desc) / 8;
|
||||
int shr = simd_data(desc);
|
||||
int shl = 8 - shr;
|
||||
uint64_t mask = dup_const(MO_8, 0xff >> shr);
|
||||
uint64_t *d = vd, *n = vn, *m = vm;
|
||||
|
||||
for (i = 0; i < opr_sz; ++i) {
|
||||
uint64_t t = n[i] ^ m[i];
|
||||
d[i] = ((t >> shr) & mask) | ((t << shl) & ~mask);
|
||||
}
|
||||
}
|
||||
|
||||
void HELPER(sve2_xar_h)(void *vd, void *vn, void *vm, uint32_t desc)
|
||||
{
|
||||
intptr_t i, opr_sz = simd_oprsz(desc) / 8;
|
||||
int shr = simd_data(desc);
|
||||
int shl = 16 - shr;
|
||||
uint64_t mask = dup_const(MO_16, 0xffff >> shr);
|
||||
uint64_t *d = vd, *n = vn, *m = vm;
|
||||
|
||||
for (i = 0; i < opr_sz; ++i) {
|
||||
uint64_t t = n[i] ^ m[i];
|
||||
d[i] = ((t >> shr) & mask) | ((t << shl) & ~mask);
|
||||
}
|
||||
}
|
||||
|
||||
void HELPER(sve2_xar_s)(void *vd, void *vn, void *vm, uint32_t desc)
|
||||
{
|
||||
intptr_t i, opr_sz = simd_oprsz(desc) / 4;
|
||||
int shr = simd_data(desc);
|
||||
uint32_t *d = vd, *n = vn, *m = vm;
|
||||
|
||||
for (i = 0; i < opr_sz; ++i) {
|
||||
d[i] = ror32(n[i] ^ m[i], shr);
|
||||
}
|
||||
}
|
||||
|
|
|
@ -14349,8 +14349,6 @@ static void disas_crypto_xar(DisasContext *s, uint32_t insn)
|
|||
int imm6 = extract32(insn, 10, 6);
|
||||
int rn = extract32(insn, 5, 5);
|
||||
int rd = extract32(insn, 0, 5);
|
||||
TCGv_i64 tcg_op1, tcg_op2, tcg_res[2];
|
||||
int pass;
|
||||
|
||||
if (!dc_isar_feature(aa64_sha3, s)) {
|
||||
unallocated_encoding(s);
|
||||
|
@ -14361,25 +14359,10 @@ static void disas_crypto_xar(DisasContext *s, uint32_t insn)
|
|||
return;
|
||||
}
|
||||
|
||||
tcg_op1 = tcg_temp_new_i64();
|
||||
tcg_op2 = tcg_temp_new_i64();
|
||||
tcg_res[0] = tcg_temp_new_i64();
|
||||
tcg_res[1] = tcg_temp_new_i64();
|
||||
|
||||
for (pass = 0; pass < 2; pass++) {
|
||||
read_vec_element(s, tcg_op1, rn, pass, MO_64);
|
||||
read_vec_element(s, tcg_op2, rm, pass, MO_64);
|
||||
|
||||
tcg_gen_xor_i64(tcg_res[pass], tcg_op1, tcg_op2);
|
||||
tcg_gen_rotri_i64(tcg_res[pass], tcg_res[pass], imm6);
|
||||
}
|
||||
write_vec_element(s, tcg_res[0], rd, 0, MO_64);
|
||||
write_vec_element(s, tcg_res[1], rd, 1, MO_64);
|
||||
|
||||
tcg_temp_free_i64(tcg_op1);
|
||||
tcg_temp_free_i64(tcg_op2);
|
||||
tcg_temp_free_i64(tcg_res[0]);
|
||||
tcg_temp_free_i64(tcg_res[1]);
|
||||
gen_gvec_xar(MO_64, vec_full_reg_offset(s, rd),
|
||||
vec_full_reg_offset(s, rn),
|
||||
vec_full_reg_offset(s, rm), imm6, 16,
|
||||
vec_full_reg_size(s));
|
||||
}
|
||||
|
||||
/* Crypto three-reg imm2
|
||||
|
|
|
@ -120,5 +120,8 @@ bool disas_sve(DisasContext *, uint32_t);
|
|||
|
||||
void gen_gvec_rax1(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||
uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
|
||||
void gen_gvec_xar(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||
uint32_t rm_ofs, int64_t shift,
|
||||
uint32_t opr_sz, uint32_t max_sz);
|
||||
|
||||
#endif /* TARGET_ARM_TRANSLATE_A64_H */
|
||||
|
|
|
@ -340,6 +340,110 @@ static bool trans_BIC_zzz(DisasContext *s, arg_rrr_esz *a)
|
|||
return do_zzz_fn(s, a, tcg_gen_gvec_andc);
|
||||
}
|
||||
|
||||
static void gen_xar8_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, int64_t sh)
|
||||
{
|
||||
TCGv_i64 t = tcg_temp_new_i64();
|
||||
uint64_t mask = dup_const(MO_8, 0xff >> sh);
|
||||
|
||||
tcg_gen_xor_i64(t, n, m);
|
||||
tcg_gen_shri_i64(d, t, sh);
|
||||
tcg_gen_shli_i64(t, t, 8 - sh);
|
||||
tcg_gen_andi_i64(d, d, mask);
|
||||
tcg_gen_andi_i64(t, t, ~mask);
|
||||
tcg_gen_or_i64(d, d, t);
|
||||
tcg_temp_free_i64(t);
|
||||
}
|
||||
|
||||
static void gen_xar16_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, int64_t sh)
|
||||
{
|
||||
TCGv_i64 t = tcg_temp_new_i64();
|
||||
uint64_t mask = dup_const(MO_16, 0xffff >> sh);
|
||||
|
||||
tcg_gen_xor_i64(t, n, m);
|
||||
tcg_gen_shri_i64(d, t, sh);
|
||||
tcg_gen_shli_i64(t, t, 16 - sh);
|
||||
tcg_gen_andi_i64(d, d, mask);
|
||||
tcg_gen_andi_i64(t, t, ~mask);
|
||||
tcg_gen_or_i64(d, d, t);
|
||||
tcg_temp_free_i64(t);
|
||||
}
|
||||
|
||||
static void gen_xar_i32(TCGv_i32 d, TCGv_i32 n, TCGv_i32 m, int32_t sh)
|
||||
{
|
||||
tcg_gen_xor_i32(d, n, m);
|
||||
tcg_gen_rotri_i32(d, d, sh);
|
||||
}
|
||||
|
||||
static void gen_xar_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, int64_t sh)
|
||||
{
|
||||
tcg_gen_xor_i64(d, n, m);
|
||||
tcg_gen_rotri_i64(d, d, sh);
|
||||
}
|
||||
|
||||
static void gen_xar_vec(unsigned vece, TCGv_vec d, TCGv_vec n,
|
||||
TCGv_vec m, int64_t sh)
|
||||
{
|
||||
tcg_gen_xor_vec(vece, d, n, m);
|
||||
tcg_gen_rotri_vec(vece, d, d, sh);
|
||||
}
|
||||
|
||||
void gen_gvec_xar(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
|
||||
uint32_t rm_ofs, int64_t shift,
|
||||
uint32_t opr_sz, uint32_t max_sz)
|
||||
{
|
||||
static const TCGOpcode vecop[] = { INDEX_op_rotli_vec, 0 };
|
||||
static const GVecGen3i ops[4] = {
|
||||
{ .fni8 = gen_xar8_i64,
|
||||
.fniv = gen_xar_vec,
|
||||
.fno = gen_helper_sve2_xar_b,
|
||||
.opt_opc = vecop,
|
||||
.vece = MO_8 },
|
||||
{ .fni8 = gen_xar16_i64,
|
||||
.fniv = gen_xar_vec,
|
||||
.fno = gen_helper_sve2_xar_h,
|
||||
.opt_opc = vecop,
|
||||
.vece = MO_16 },
|
||||
{ .fni4 = gen_xar_i32,
|
||||
.fniv = gen_xar_vec,
|
||||
.fno = gen_helper_sve2_xar_s,
|
||||
.opt_opc = vecop,
|
||||
.vece = MO_32 },
|
||||
{ .fni8 = gen_xar_i64,
|
||||
.fniv = gen_xar_vec,
|
||||
.fno = gen_helper_gvec_xar_d,
|
||||
.opt_opc = vecop,
|
||||
.vece = MO_64 }
|
||||
};
|
||||
int esize = 8 << vece;
|
||||
|
||||
/* The SVE2 range is 1 .. esize; the AdvSIMD range is 0 .. esize-1. */
|
||||
tcg_debug_assert(shift >= 0);
|
||||
tcg_debug_assert(shift <= esize);
|
||||
shift &= esize - 1;
|
||||
|
||||
if (shift == 0) {
|
||||
/* xar with no rotate devolves to xor. */
|
||||
tcg_gen_gvec_xor(vece, rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz);
|
||||
} else {
|
||||
tcg_gen_gvec_3i(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz,
|
||||
shift, &ops[vece]);
|
||||
}
|
||||
}
|
||||
|
||||
static bool trans_XAR(DisasContext *s, arg_rrri_esz *a)
|
||||
{
|
||||
if (a->esz < 0 || !dc_isar_feature(aa64_sve2, s)) {
|
||||
return false;
|
||||
}
|
||||
if (sve_access_check(s)) {
|
||||
unsigned vsz = vec_full_reg_size(s);
|
||||
gen_gvec_xar(a->esz, vec_full_reg_offset(s, a->rd),
|
||||
vec_full_reg_offset(s, a->rn),
|
||||
vec_full_reg_offset(s, a->rm), a->imm, vsz, vsz);
|
||||
}
|
||||
return true;
|
||||
}
|
||||
|
||||
static bool do_sve2_zzzz_fn(DisasContext *s, arg_rrrr_esz *a, GVecGen4Fn *fn)
|
||||
{
|
||||
if (!dc_isar_feature(aa64_sve2, s)) {
|
||||
|
|
|
@ -2253,3 +2253,15 @@ void HELPER(gvec_umulh_d)(void *vd, void *vn, void *vm, uint32_t desc)
|
|||
}
|
||||
clear_tail(d, opr_sz, simd_maxsz(desc));
|
||||
}
|
||||
|
||||
void HELPER(gvec_xar_d)(void *vd, void *vn, void *vm, uint32_t desc)
|
||||
{
|
||||
intptr_t i, opr_sz = simd_oprsz(desc) / 8;
|
||||
int shr = simd_data(desc);
|
||||
uint64_t *d = vd, *n = vn, *m = vm;
|
||||
|
||||
for (i = 0; i < opr_sz; ++i) {
|
||||
d[i] = ror64(n[i] ^ m[i], shr);
|
||||
}
|
||||
clear_tail(d, opr_sz * 8, simd_maxsz(desc));
|
||||
}
|
||||
|
|
Loading…
Reference in New Issue