SciSharp
diff --git a/‎src/TensorFlowNET.Core/APIs/tf.nn.cs‎
Lines changed: 6 additions & 4 deletions b/‎src/TensorFlowNET.Core/APIs/tf.nn.cs‎
Lines changed: 6 additions & 4 deletions
diff --git a/‎src/TensorFlowNET.Core/Binding.Util.cs‎
Lines changed: 1 addition & 1 deletion b/‎src/TensorFlowNET.Core/Binding.Util.cs‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/TensorFlowNET.Core/Contexts/Context.cs‎
Lines changed: 1 addition & 1 deletion b/‎src/TensorFlowNET.Core/Contexts/Context.cs‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/TensorFlowNET.Core/Eager/EagerRunner.MustRecordGradient.cs‎
Lines changed: 15 additions & 0 deletions b/‎src/TensorFlowNET.Core/Eager/EagerRunner.MustRecordGradient.cs‎
Lines changed: 15 additions & 0 deletions
diff --git a/‎src/TensorFlowNET.Core/Eager/IEagerRunner.cs‎
Lines changed: 2 additions & 0 deletions b/‎src/TensorFlowNET.Core/Eager/IEagerRunner.cs‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/TensorFlowNET.Core/Framework/smart_module.cs‎
Lines changed: 1 addition & 1 deletion b/‎src/TensorFlowNET.Core/Framework/smart_module.cs‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/TensorFlowNET.Core/Operations/NnOps/gen_nn_ops.cs‎
Lines changed: 47 additions & 27 deletions b/‎src/TensorFlowNET.Core/Operations/NnOps/gen_nn_ops.cs‎
Lines changed: 47 additions & 27 deletions
diff --git a/‎src/TensorFlowNET.Core/Operations/gen_resource_variable_ops.cs‎
Lines changed: 1 addition & 1 deletion b/‎src/TensorFlowNET.Core/Operations/gen_resource_variable_ops.cs‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/TensorFlowNET.Core/Operations/nn_impl.py.cs‎
Lines changed: 13 additions & 11 deletions b/‎src/TensorFlowNET.Core/Operations/nn_impl.py.cs‎
Lines changed: 13 additions & 11 deletions
diff --git a/‎src/TensorFlowNET.Core/Operations/nn_ops.cs‎
Lines changed: 21 additions & 19 deletions b/‎src/TensorFlowNET.Core/Operations/nn_ops.cs‎
Lines changed: 21 additions & 19 deletions
@@ -126,16 +126,18 @@ public Tensor relu(Tensor features, string name = null)
             public Tensor[] fused_batch_norm(Tensor x,
                 IVariableV1 scale,
                 IVariableV1 offset,
-                Tensor mean = null,
-                Tensor variance = null,
+                IVariableV1 mean = null,
+                IVariableV1 variance = null,
                 float epsilon = 0.001f,
                 string data_format = "NHWC",
                 bool is_training = true,
-                string name = null) => nn_impl.fused_batch_norm(x, scale, offset, mean, variance,
+                string name = null,
+                float exponential_avg_factor = 1.0f) => nn_impl.fused_batch_norm(x, scale, offset, mean, variance,
                     epsilon: epsilon,
                     data_format: data_format,
                     is_training: is_training,
-                    name: name);
+                    name: name,
+                    exponential_avg_factor: exponential_avg_factor);
 
             public Tensor max_pool(Tensor value, int[] ksize, int[] strides, string padding, string data_format = "NHWC", string name = null)
                 => nn_ops.max_pool(value, ksize, strides, padding, data_format: data_format, name: name);
 
@@ -180,7 +180,7 @@ public static void tf_with(ITensorFlowObject py, Action<ITensorFlowObject> actio
             }
         }
 
-        // [DebuggerStepThrough]
+        [DebuggerStepThrough]
         public static void tf_with<T>(T py, Action<T> action) where T : ITensorFlowObject
         {
             try
 
@@ -91,7 +91,7 @@ public void restore_mode()
         }
 
         [DebuggerStepThrough]
-        public Tensor RunInAutoMode(Func<Tensor> graphAction, Func<Tensor> eagerAction, params Tensor[] tensors)
+        public T RunInAutoMode<T>(Func<T> graphAction, Func<T> eagerAction, params Tensor[] tensors)
         {
             var shouldRunInEager = executing_eagerly()
                 && tensors.Count(x => x.IsEagerTensor) == tensors.Length;
 
@@ -0,0 +1,15 @@
+using System;
+using Tensorflow.Gradients;
+using static Tensorflow.Binding;
+using static Tensorflow.tensorflow;
+
+namespace Tensorflow.Eager
+{
+    public partial class EagerRunner
+    {
+        public bool MustRecordGradient()
+        {
+            return HasGradientTape();
+        }
+    }
+}
@@ -38,5 +38,7 @@ bool RecordGradient(string op_name,
             Tensor[] inputs,
             object[] attrs,
             Tensor[] results);
+
+        bool MustRecordGradient();
     }
 }
@@ -52,7 +52,7 @@ public static Tensor smart_cond(bool pred,
         {
             var pred_value = tensor_util.constant_value(pred);
             if (pred_value is null)
-                return null;
+                return pred.eval(new Session(pred.graph));
 
             return pred_value;
         }
 
@@ -269,21 +269,29 @@ public static Tensor[] fused_batch_norm_grad(FusedBatchNormParams @params)
         }
 
         public static Tensor[] fused_batch_norm_grad_v3(FusedBatchNormParams @params)
-        {
-            var op = tf.OpDefLib._apply_op_helper("FusedBatchNormGradV3", name: @params.Name, args: new
-            {
-                y_backprop = @params.YBackprop,
-                x = @params.X,
-                scale = @params.Scale,
-                reserve_space_1 = @params.ReserveSpace1,
-                reserve_space_2 = @params.ReserveSpace2,
-                reserve_space_3 = @params.ReserveSpace3,
-                epsilon = @params.Epsilon,
-                data_format = @params.DataFormat,
-                is_training = @params.IsTraining
-            });
-            return op.outputs;
-        }
+            => tf.Context.RunInAutoMode(()
+                => tf.OpDefLib._apply_op_helper("FusedBatchNormGradV3", name: @params.Name,
+                    args: new 
+                    {
+                        y_backprop = @params.YBackprop,
+                        x = @params.X,
+                        scale = @params.Scale,
+                        reserve_space_1 = @params.ReserveSpace1,
+                        reserve_space_2 = @params.ReserveSpace2,
+                        reserve_space_3 = @params.ReserveSpace3,
+                        epsilon = @params.Epsilon,
+                        data_format = @params.DataFormat,
+                        is_training = @params.IsTraining
+                    }).outputs, ()
+                => tf.Runner.TFE_FastPathExecute(tf.Context, tf.Context.DeviceName,
+                    "FusedBatchNormGradV3", @params.Name,
+                    null,
+                    @params.YBackprop, @params.X, @params.Scale,
+                    @params.ReserveSpace1, @params.ReserveSpace2, @params.ReserveSpace3,
+                    "epsilon", @params.Epsilon, 
+                    "data_format", @params.DataFormat, 
+                    "is_training", @params.IsTraining),
+                @params.YBackprop);
 
         public static Tensor[] fused_batch_norm(Tensor x,
                 Tensor scale,
@@ -313,9 +321,10 @@ public static Tensor[] fused_batch_norm(Tensor x,
         public static Tensor[] fused_batch_norm_v3(Tensor x,
         Tensor scale,
         Tensor offset,
-        Tensor mean,
-        Tensor variance,
+        IVariableV1 mean,
+        IVariableV1 variance,
         float epsilon = 0.0001f,
+        float exponential_avg_factor = 1.0f,
         string data_format = "NHWC",
         bool is_training = true,
         string name = null)
@@ -328,9 +337,10 @@ public static Tensor[] fused_batch_norm_v3(Tensor x,
                     x,
                     scale,
                     offset,
-                    mean,
-                    variance,
+                    mean.AsTensor(),
+                    variance.AsTensor(),
                     "epsilon", epsilon,
+                    "exponential_avg_factor", exponential_avg_factor,
                     "data_format", data_format,
                     "is_training", is_training);
 
@@ -378,14 +388,14 @@ public static Tensor local_response_normalization(Tensor input, int depth_radius
         }
 
         public static Tensor log_softmax(Tensor logits, string name = null)
-        {
-            var _op = tf.OpDefLib._apply_op_helper("LogSoftmax", name: name, args: new
-            {
-                logits
-            });
-
-            return _op.output;
-        }
+            => tf.Context.RunInAutoMode(()
+                => tf.OpDefLib._apply_op_helper("LogSoftmax", name: name,
+                    args: new { logits }).output, ()
+                => tf.Runner.TFE_FastPathExecute(tf.Context, tf.Context.DeviceName,
+                    "LogSoftmax", name,
+                    null,
+                    logits).FirstOrDefault(),
+                logits);
 
         /// <summary>
         /// Says whether the targets are in the top `K` predictions.
@@ -560,6 +570,16 @@ public static Tensor softmax(Tensor logits, string name = null)
         /// <returns></returns>
         public static (Tensor, Tensor) softmax_cross_entropy_with_logits(Tensor features, Tensor labels, string name = null)
         {
+            if (tf.executing_eagerly())
+            {
+                var results = tf.Runner.TFE_FastPathExecute(tf.Context, tf.Context.DeviceName,
+                    "SoftmaxCrossEntropyWithLogits", name,
+                    null,
+                    features, labels);
+
+                return (results[0], results[1]);
+            }
+
             var _op = tf.OpDefLib._apply_op_helper("SoftmaxCrossEntropyWithLogits", name: name, args: new
             {
                 features,
 
@@ -68,7 +68,7 @@ public static Operation assign_variable_op(Tensor resource, Tensor value, string
                     null,
                     resource, value);
 
-                return null;
+                return results.Length == 0 ? null : results[0];
             }
 
             var _op = tf.OpDefLib._apply_op_helper("AssignVariableOp", name, new { resource, value });
 
@@ -99,20 +99,21 @@ public static (Tensor, Tensor) moments(Tensor x,
         public static Tensor[] fused_batch_norm(Tensor x,
             IVariableV1 scale,
             IVariableV1 offset,
-            Tensor mean,
-            Tensor variance,
+            IVariableV1 mean,
+            IVariableV1 variance,
             float epsilon = 0.001f,
             string data_format = "NHWC",
             bool is_training = true,
-            string name = null)
+            string name = null,
+            float exponential_avg_factor = 1.0f)
         {
             x = ops.convert_to_tensor(x, name: "input");
             var scale_tensor = ops.convert_to_tensor(scale, name: "scale");
             var offset_tensor = ops.convert_to_tensor(offset, name: "offset");
-            if (mean == null)
+            /*if (mean == null)
                 mean = constant_op.constant(new float[0]);
             if (variance == null)
-                variance = constant_op.constant(new float[0]);
+                variance = constant_op.constant(new float[0]);*/
             var min_epsilon = 1.001e-5f;
             epsilon = epsilon > min_epsilon ? epsilon : min_epsilon;
 
@@ -122,15 +123,16 @@ public static Tensor[] fused_batch_norm(Tensor x,
                 mean,
                 variance,
                 epsilon,
-                data_format,
-                is_training,
-                name);
+                exponential_avg_factor: exponential_avg_factor,
+                data_format: data_format,
+                is_training: is_training,
+                name: name);
 
             var y = results[0];
-            var batch_mean = results[1];
-            var batch_var = results[2];
+            var running_mean = results[1];
+            var running_var = results[2];
 
-            return new[] { y, batch_mean, batch_var };
+            return new[] { y, running_mean, running_var };
         }
 
         /// <summary>
 
@@ -255,7 +255,7 @@ public static Tensor softmax_cross_entropy_with_logits_v2_helper(Tensor labels,
 
                 // The output cost shape should be the input minus axis.
                 var output_shape = array_ops.slice(input_shape,
-                    new int[] { 0 },
+                    new Tensor[] { constant_op.constant(0) },
                     new Tensor[] { math_ops.subtract(input_rank, 1) });
 
                 cost = array_ops.reshape(cost, output_shape);
@@ -274,36 +274,38 @@ private static Tensor _flatten_outer_dims(Tensor logits)
             var rank = array_ops.rank(logits);
             var last_dim_size = array_ops.slice(array_ops.shape(logits),
                 new[] { math_ops.subtract(rank, 1) },
-                new[] { 1 });
+                new[] { constant_op.constant(1) });
 
             var ops = array_ops.concat(new[] { new[] { -1 }, (object)last_dim_size }, 0);
             var output = array_ops.reshape(logits, ops);
 
             // Set output shape if known.
-            // if not context.executing_eagerly():
-            var shape = logits.TensorShape;
-            if (shape != null && shape.ndim > 0)
+            if (!tf.Context.executing_eagerly())
             {
-                var product = 1;
-                var product_valid = true;
-                foreach (var d in shape.dims.Take(shape.ndim - 1))
+                var shape = logits.TensorShape;
+                if (shape != null && shape.ndim > 0)
                 {
-                    if (d == -1)
+                    var product = 1;
+                    var product_valid = true;
+                    foreach (var d in shape.dims.Take(shape.ndim - 1))
                     {
-                        product_valid = false;
-                        break;
+                        if (d == -1)
+                        {
+                            product_valid = false;
+                            break;
+                        }
+                        else
+                        {
+                            product *= d;
+                        }
                     }
-                    else
+
+                    if (product_valid)
                     {
-                        product *= d;
+                        var output_shape = new[] { product };
+                        throw new NotImplementedException("_flatten_outer_dims product_valid");
                     }
                 }
-
-                if (product_valid)
-                {
-                    var output_shape = new[] { product };
-                    throw new NotImplementedException("_flatten_outer_dims product_valid");
-                }
             }
 
             return output;
Original file line number	Diff line number	Diff line change
`@@ -180,7 +180,7 @@ public static void tf_with(ITensorFlowObject py, Action<ITensorFlowObject> actio`
`180`	`180`	`}`
`181`	`181`	`}`
`182`	`182`
`183`		`- // [DebuggerStepThrough]`
	`183`	`+ [DebuggerStepThrough]`
`184`	`184`	`public static void tf_with<T>(T py, Action<T> action) where T : ITensorFlowObject`
`185`	`185`	`{`
`186`	`186`	`try`
Original file line number	Diff line number	Diff line change
`@@ -91,7 +91,7 @@ public void restore_mode()`
`91`	`91`	`}`
`92`	`92`
`93`	`93`	`[DebuggerStepThrough]`
`94`		`- public Tensor RunInAutoMode(Func<Tensor> graphAction, Func<Tensor> eagerAction, params Tensor[] tensors)`
	`94`	`+ public T RunInAutoMode<T>(Func<T> graphAction, Func<T> eagerAction, params Tensor[] tensors)`
`95`	`95`	`{`
`96`	`96`	`var shouldRunInEager = executing_eagerly()`
`97`	`97`	`&& tensors.Count(x => x.IsEagerTensor) == tensors.Length;`
Original file line number	Diff line number	Diff line change
`@@ -38,5 +38,7 @@ bool RecordGradient(string op_name,`
`38`	`38`	`Tensor[] inputs,`
`39`	`39`	`object[] attrs,`
`40`	`40`	`Tensor[] results);`
	`41`	`+`
	`42`	`+ bool MustRecordGradient();`
`41`	`43`	`}`
`42`	`44`	`}`
Original file line number	Diff line number	Diff line change
`@@ -52,7 +52,7 @@ public static Tensor smart_cond(bool pred,`
`52`	`52`	`{`
`53`	`53`	`var pred_value = tensor_util.constant_value(pred);`
`54`	`54`	`if (pred_value is null)`
`55`		`- return null;`
	`55`	`+ return pred.eval(new Session(pred.graph));`
`56`	`56`
`57`	`57`	`return pred_value;`
`58`	`58`	`}`
Original file line number	Diff line number	Diff line change
`@@ -68,7 +68,7 @@ public static Operation assign_variable_op(Tensor resource, Tensor value, string`
`68`	`68`	`null,`
`69`	`69`	`resource, value);`
`70`	`70`
`71`		`- return null;`
	`71`	`+ return results.Length == 0 ? null : results[0];`
`72`	`72`	`}`
`73`	`73`
`74`	`74`	`var _op = tf.OpDefLib._apply_op_helper("AssignVariableOp", name, new { resource, value });`