@@ -128,43 +128,113 @@ define i64 @ctz_nxv8i1_no_range(<vscale x 8 x i16> %a) {
128128define i32 @ctz_nxv16i1 (<vscale x 16 x i1 > %pg , <vscale x 16 x i1 > %a ) {
129129; RV32-LABEL: ctz_nxv16i1:
130130; RV32: # %bb.0:
131- ; RV32-NEXT: vmv1r.v v0, v8
131+ ; RV32-NEXT: vsetvli a0, zero, e8, m2, ta, ma
132+ ; RV32-NEXT: vfirst.m a0, v8
133+ ; RV32-NEXT: bgez a0, .LBB2_2
134+ ; RV32-NEXT: # %bb.1:
132135; RV32-NEXT: csrr a0, vlenb
133136; RV32-NEXT: slli a0, a0, 1
134- ; RV32-NEXT: vsetvli a1, zero, e32, m8, ta, ma
135- ; RV32-NEXT: vmv.v.x v8, a0
136- ; RV32-NEXT: vid.v v16
137- ; RV32-NEXT: li a1, -1
138- ; RV32-NEXT: vmadd.vx v16, a1, v8
139- ; RV32-NEXT: vmv.v.i v8, 0
140- ; RV32-NEXT: vmerge.vvm v8, v8, v16, v0
141- ; RV32-NEXT: vredmaxu.vs v8, v8, v8
142- ; RV32-NEXT: vmv.x.s a1, v8
143- ; RV32-NEXT: sub a0, a0, a1
137+ ; RV32-NEXT: .LBB2_2:
144138; RV32-NEXT: ret
145139;
146140; RV64-LABEL: ctz_nxv16i1:
147141; RV64: # %bb.0:
148- ; RV64-NEXT: vmv1r.v v0, v8
142+ ; RV64-NEXT: vsetvli a0, zero, e8, m2, ta, ma
143+ ; RV64-NEXT: vfirst.m a0, v8
144+ ; RV64-NEXT: bgez a0, .LBB2_2
145+ ; RV64-NEXT: # %bb.1:
149146; RV64-NEXT: csrr a0, vlenb
150147; RV64-NEXT: slli a0, a0, 1
151- ; RV64-NEXT: vsetvli a1, zero, e32, m8, ta, ma
152- ; RV64-NEXT: vmv.v.x v8, a0
153- ; RV64-NEXT: vid.v v16
154- ; RV64-NEXT: li a1, -1
155- ; RV64-NEXT: vmadd.vx v16, a1, v8
156- ; RV64-NEXT: vmv.v.i v8, 0
157- ; RV64-NEXT: vmerge.vvm v8, v8, v16, v0
158- ; RV64-NEXT: vredmaxu.vs v8, v8, v8
159- ; RV64-NEXT: vmv.x.s a1, v8
160- ; RV64-NEXT: subw a0, a0, a1
148+ ; RV64-NEXT: .LBB2_2:
161149; RV64-NEXT: ret
162150 %res = call i32 @llvm.experimental.cttz.elts.i32.nxv16i1 (<vscale x 16 x i1 > %a , i1 0 )
163151 ret i32 %res
164152}
165153
154+ define i32 @ctz_nxv16i1_poison (<vscale x 16 x i1 > %pg , <vscale x 16 x i1 > %a ) {
155+ ; RV32-LABEL: ctz_nxv16i1_poison:
156+ ; RV32: # %bb.0:
157+ ; RV32-NEXT: vsetvli a0, zero, e8, m2, ta, ma
158+ ; RV32-NEXT: vfirst.m a0, v8
159+ ; RV32-NEXT: ret
160+ ;
161+ ; RV64-LABEL: ctz_nxv16i1_poison:
162+ ; RV64: # %bb.0:
163+ ; RV64-NEXT: vsetvli a0, zero, e8, m2, ta, ma
164+ ; RV64-NEXT: vfirst.m a0, v8
165+ ; RV64-NEXT: ret
166+ %res = call i32 @llvm.experimental.cttz.elts.i32.nxv16i1 (<vscale x 16 x i1 > %a , i1 1 )
167+ ret i32 %res
168+ }
169+
170+ define i32 @ctz_v16i1 (<16 x i1 > %pg , <16 x i1 > %a ) {
171+ ; RV32-LABEL: ctz_v16i1:
172+ ; RV32: # %bb.0:
173+ ; RV32-NEXT: vsetivli zero, 16, e8, m1, ta, ma
174+ ; RV32-NEXT: vfirst.m a0, v8
175+ ; RV32-NEXT: bgez a0, .LBB4_2
176+ ; RV32-NEXT: # %bb.1:
177+ ; RV32-NEXT: li a0, 16
178+ ; RV32-NEXT: .LBB4_2:
179+ ; RV32-NEXT: ret
180+ ;
181+ ; RV64-LABEL: ctz_v16i1:
182+ ; RV64: # %bb.0:
183+ ; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, ma
184+ ; RV64-NEXT: vfirst.m a0, v8
185+ ; RV64-NEXT: bgez a0, .LBB4_2
186+ ; RV64-NEXT: # %bb.1:
187+ ; RV64-NEXT: li a0, 16
188+ ; RV64-NEXT: .LBB4_2:
189+ ; RV64-NEXT: ret
190+ %res = call i32 @llvm.experimental.cttz.elts.i32.v16i1 (<16 x i1 > %a , i1 0 )
191+ ret i32 %res
192+ }
193+
194+ define i32 @ctz_v16i1_poison (<16 x i1 > %pg , <16 x i1 > %a ) {
195+ ; RV32-LABEL: ctz_v16i1_poison:
196+ ; RV32: # %bb.0:
197+ ; RV32-NEXT: vsetivli zero, 16, e8, m1, ta, ma
198+ ; RV32-NEXT: vfirst.m a0, v8
199+ ; RV32-NEXT: ret
200+ ;
201+ ; RV64-LABEL: ctz_v16i1_poison:
202+ ; RV64: # %bb.0:
203+ ; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, ma
204+ ; RV64-NEXT: vfirst.m a0, v8
205+ ; RV64-NEXT: ret
206+ %res = call i32 @llvm.experimental.cttz.elts.i32.v16i1 (<16 x i1 > %a , i1 1 )
207+ ret i32 %res
208+ }
209+
210+ define i16 @ctz_v8i1_i16_ret (<8 x i1 > %a ) {
211+ ; RV32-LABEL: ctz_v8i1_i16_ret:
212+ ; RV32: # %bb.0:
213+ ; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
214+ ; RV32-NEXT: vfirst.m a0, v0
215+ ; RV32-NEXT: bgez a0, .LBB6_2
216+ ; RV32-NEXT: # %bb.1:
217+ ; RV32-NEXT: li a0, 8
218+ ; RV32-NEXT: .LBB6_2:
219+ ; RV32-NEXT: ret
220+ ;
221+ ; RV64-LABEL: ctz_v8i1_i16_ret:
222+ ; RV64: # %bb.0:
223+ ; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
224+ ; RV64-NEXT: vfirst.m a0, v0
225+ ; RV64-NEXT: bgez a0, .LBB6_2
226+ ; RV64-NEXT: # %bb.1:
227+ ; RV64-NEXT: li a0, 8
228+ ; RV64-NEXT: .LBB6_2:
229+ ; RV64-NEXT: ret
230+ %res = call i16 @llvm.experimental.cttz.elts.i16.v8i1 (<8 x i1 > %a , i1 0 )
231+ ret i16 %res
232+ }
233+
166234declare i64 @llvm.experimental.cttz.elts.i64.nxv8i16 (<vscale x 8 x i16 >, i1 )
167235declare i32 @llvm.experimental.cttz.elts.i32.nxv16i1 (<vscale x 16 x i1 >, i1 )
168236declare i32 @llvm.experimental.cttz.elts.i32.nxv4i32 (<vscale x 4 x i32 >, i1 )
237+ declare i32 @llvm.experimental.cttz.elts.i32.v16i1 (<16 x i1 >, i1 )
238+ declare i16 @llvm.experimental.cttz.elts.i16.v16i1 (<8 x i1 >, i1 )
169239
170240attributes #0 = { vscale_range(2 ,1024 ) }
0 commit comments