@@ -131,21 +131,6 @@ gpu.module @test_module {
131
131
132
132
// -----
133
133
134
- gpu.module @test_module {
135
- // CHECK: llvm.func @__ocml_fabs_f32(f32) -> f32
136
- // CHECK: llvm.func @__ocml_fabs_f64(f64) -> f64
137
- // CHECK-LABEL: func @gpu_fabs
138
- func.func @gpu_fabs (%arg_f32 : f32 , %arg_f64 : f64 ) -> (f32 , f64 ) {
139
- %result32 = math.absf %arg_f32 : f32
140
- // CHECK: llvm.call @__ocml_fabs_f32(%{{.*}}) : (f32) -> f32
141
- %result64 = math.absf %arg_f64 : f64
142
- // CHECK: llvm.call @__ocml_fabs_f64(%{{.*}}) : (f64) -> f64
143
- func.return %result32 , %result64 : f32 , f64
144
- }
145
- }
146
-
147
- // -----
148
-
149
134
gpu.module @test_module {
150
135
// CHECK: llvm.func @__ocml_cbrt_f32(f32) -> f32
151
136
// CHECK: llvm.func @__ocml_cbrt_f64(f64) -> f64
@@ -207,17 +192,12 @@ gpu.module @test_module {
207
192
// -----
208
193
209
194
gpu.module @test_module {
210
- // CHECK: llvm.func @__ocml_exp_f32(f32) -> f32
211
195
// CHECK: llvm.func @__ocml_exp_f64(f64) -> f64
212
196
// CHECK-LABEL: func @gpu_exp
213
- func.func @gpu_exp (%arg_f32 : f32 , %arg_f64 : f64 ) -> (f32 , f64 ) {
214
- %exp_f32 = math.exp %arg_f32 : f32
215
- // CHECK: llvm.call @__ocml_exp_f32(%{{.*}}) : (f32) -> f32
216
- %result32 = math.exp %exp_f32 : f32
217
- // CHECK: llvm.call @__ocml_exp_f32(%{{.*}}) : (f32) -> f32
197
+ func.func @gpu_exp (%arg_f64 : f64 ) -> (f64 ) {
218
198
%result64 = math.exp %arg_f64 : f64
219
199
// CHECK: llvm.call @__ocml_exp_f64(%{{.*}}) : (f64) -> f64
220
- func.return %result32 , % result64 : f32 , f64
200
+ func.return %result64 : f64
221
201
}
222
202
}
223
203
@@ -239,21 +219,20 @@ gpu.module @test_module {
239
219
}
240
220
241
221
// -----
242
-
243
222
// Test that we handled properly operation with SymbolTable other than module op
244
223
gpu.module @test_module {
245
224
" test.symbol_scope" () ({
246
225
// CHECK: test.symbol_scope
247
- // CHECK: llvm.func @__ocml_exp_f32 (f32) -> f32
248
- // CHECK: llvm.func @__ocml_exp_f64 (f64) -> f64
249
- // CHECK-LABEL: func @gpu_exp
250
- func.func @gpu_exp (%arg_f32 : f32 , %arg_f64 : f64 ) -> (f32 , f64 ) {
251
- %exp_f32 = math.exp %arg_f32 : f32
252
- // CHECK: llvm.call @__ocml_exp_f32 (%{{.*}}) : (f32) -> f32
253
- %result32 = math.exp %exp_f32 : f32
254
- // CHECK: llvm.call @__ocml_exp_f32 (%{{.*}}) : (f32) -> f32
255
- %result64 = math.exp %arg_f64 : f64
256
- // CHECK: llvm.call @__ocml_exp_f64 (%{{.*}}) : (f64) -> f64
226
+ // CHECK: llvm.func @__ocml_sin_f32 (f32) -> f32
227
+ // CHECK: llvm.func @__ocml_sin_f64 (f64) -> f64
228
+ // CHECK-LABEL: func @gpu_sin
229
+ func.func @gpu_sin (%arg_f32 : f32 , %arg_f64 : f64 ) -> (f32 , f64 ) {
230
+ %sin_f32 = math.sin %arg_f32 : f32
231
+ // CHECK: llvm.call @__ocml_sin_f32 (%{{.*}}) : (f32) -> f32
232
+ %result32 = math.sin %sin_f32 : f32
233
+ // CHECK: llvm.call @__ocml_sin_f32 (%{{.*}}) : (f32) -> f32
234
+ %result64 = math.sin %arg_f64 : f64
235
+ // CHECK: llvm.call @__ocml_sin_f64 (%{{.*}}) : (f64) -> f64
257
236
func.return %result32 , %result64 : f32 , f64
258
237
}
259
238
" test.finish" () : () -> ()
@@ -280,15 +259,12 @@ gpu.module @test_module {
280
259
// -----
281
260
282
261
gpu.module @test_module {
283
- // CHECK: llvm.func @__ocml_log_f32(f32) -> f32
284
262
// CHECK: llvm.func @__ocml_log_f64(f64) -> f64
285
263
// CHECK-LABEL: func @gpu_log
286
- func.func @gpu_log (%arg_f32 : f32 , %arg_f64 : f64 ) -> (f32 , f64 ) {
287
- %result32 = math.log %arg_f32 : f32
288
- // CHECK: llvm.call @__ocml_log_f32(%{{.*}}) : (f32) -> f32
264
+ func.func @gpu_log (%arg_f64 : f64 ) -> (f64 ) {
289
265
%result64 = math.log %arg_f64 : f64
290
266
// CHECK: llvm.call @__ocml_log_f64(%{{.*}}) : (f64) -> f64
291
- func.return %result32 , % result64 : f32 , f64
267
+ func.return %result64 : f64
292
268
}
293
269
}
294
270
@@ -359,26 +335,6 @@ gpu.module @test_module {
359
335
360
336
// -----
361
337
362
- gpu.module @test_module {
363
- // CHECK: llvm.func @__ocml_sqrt_f32(f32) -> f32
364
- // CHECK: llvm.func @__ocml_sqrt_f64(f64) -> f64
365
- // CHECK-LABEL: func @gpu_sqrt
366
- func.func @gpu_sqrt (%arg_f16 : f16 , %arg_f32 : f32 , %arg_f64 : f64 )
367
- -> (f16 , f32 , f64 ) {
368
- %result16 = math.sqrt %arg_f16 : f16
369
- // CHECK: llvm.fpext %{{.*}} : f16 to f32
370
- // CHECK-NEXT: llvm.call @__ocml_sqrt_f32(%{{.*}}) : (f32) -> f32
371
- // CHECK-NEXT: llvm.fptrunc %{{.*}} : f32 to f16
372
- %result32 = math.sqrt %arg_f32 : f32
373
- // CHECK: llvm.call @__ocml_sqrt_f32(%{{.*}}) : (f32) -> f32
374
- %result64 = math.sqrt %arg_f64 : f64
375
- // CHECK: llvm.call @__ocml_sqrt_f64(%{{.*}}) : (f64) -> f64
376
- func.return %result16 , %result32 , %result64 : f16 , f32 , f64
377
- }
378
- }
379
-
380
- // -----
381
-
382
338
gpu.module @test_module {
383
339
// CHECK: llvm.func @__ocml_tan_f32(f32) -> f32
384
340
// CHECK: llvm.func @__ocml_tan_f64(f64) -> f64
@@ -472,15 +428,15 @@ gpu.module @test_module {
472
428
gpu.module @test_module {
473
429
// CHECK-LABEL: func @gpu_unroll
474
430
func.func @gpu_unroll (%arg0 : vector <4 xf32 >) -> vector <4 xf32 > {
475
- %result = math.exp %arg0 : vector <4 xf32 >
431
+ %result = math.sin %arg0 : vector <4 xf32 >
476
432
// CHECK: %[[V0:.+]] = llvm.mlir.undef : vector<4xf32>
477
- // CHECK: %[[CL:.+]] = llvm.call @__ocml_exp_f32 (%{{.*}}) : (f32) -> f32
433
+ // CHECK: %[[CL:.+]] = llvm.call @__ocml_sin_f32 (%{{.*}}) : (f32) -> f32
478
434
// CHECK: %[[V1:.+]] = llvm.insertelement %[[CL]], %[[V0]]
479
- // CHECK: %[[CL:.+]] = llvm.call @__ocml_exp_f32 (%{{.*}}) : (f32) -> f32
435
+ // CHECK: %[[CL:.+]] = llvm.call @__ocml_sin_f32 (%{{.*}}) : (f32) -> f32
480
436
// CHECK: %[[V2:.+]] = llvm.insertelement %[[CL]], %[[V1]]
481
- // CHECK: %[[CL:.+]] = llvm.call @__ocml_exp_f32 (%{{.*}}) : (f32) -> f32
437
+ // CHECK: %[[CL:.+]] = llvm.call @__ocml_sin_f32 (%{{.*}}) : (f32) -> f32
482
438
// CHECK: %[[V3:.+]] = llvm.insertelement %[[CL]], %[[V2]]
483
- // CHECK: %[[CL:.+]] = llvm.call @__ocml_exp_f32 (%{{.*}}) : (f32) -> f32
439
+ // CHECK: %[[CL:.+]] = llvm.call @__ocml_sin_f32 (%{{.*}}) : (f32) -> f32
484
440
// CHECK: %[[V4:.+]] = llvm.insertelement %[[CL]], %[[V3]]
485
441
// CHECK: return %[[V4]]
486
442
func.return %result : vector <4 xf32 >
@@ -526,9 +482,9 @@ gpu.module @test_module {
526
482
527
483
gpu.module @module {
528
484
// CHECK-LABEL: @spirv_exp
529
- // CHECK: llvm.call @__ocml_exp_f32
485
+ // CHECK: llvm.call @__ocml_sin_f32
530
486
spirv.func @spirv_exp (%arg0: vector <4 xf32 >) -> vector <4 xf32 > " None" {
531
- %0 = math.exp %arg0 : vector <4 xf32 >
487
+ %0 = math.sin %arg0 : vector <4 xf32 >
532
488
spirv.ReturnValue %0 : vector <4 xf32 >
533
489
}
534
490
}
0 commit comments