move out _make_ funcs from Net class

ayasyrev · ayasyrev · commit dd010786f1a5 · 2020-03-05T18:33:12.000+03:00
diff --git a/model_constructor/net.py b/model_constructor/net.py
@@ -66,6 +66,41 @@ def forward(self, x):
         o = self.reduce(x)
         return self.merge(self.convs(o) + self.idconv(o))
 
+# Cell
+def _make_stem(self):
+        stem = [(f"conv_{i}", self.conv_layer(self.stem_sizes[i], self.stem_sizes[i+1],
+                    stride=2 if i==0 else 1,
+                    bn_layer=(not self.stem_bn_end) if i==(len(self.stem_sizes)-2) else True,
+                    act_fn=self.act_fn, bn_1st=self.bn_1st))
+                for i in range(len(self.stem_sizes)-1)]
+        stem.append(('stem_pool', self.stem_pool))
+        if self.stem_bn_end: stem.append(('norm', self.norm(self.stem_sizes[-1])))
+        return nn.Sequential(OrderedDict(stem))
+
+# Cell
+def _make_layer(self,expansion,ni,nf,blocks,stride,sa):
+        return nn.Sequential(OrderedDict(
+            [(f"bl_{i}", self.block(expansion, ni if i==0 else nf, nf,
+                    stride if i==0 else 1, sa=sa if i==blocks-1 else False,
+                    conv_layer=self.conv_layer, act_fn=self.act_fn, pool=self.pool,
+                                    zero_bn=self.zero_bn, bn_1st=self.bn_1st))
+              for i in range(blocks)]))
+
+# Cell
+def _make_body(self):
+        blocks = [(f"l_{i}", self._make_layer(self,self.expansion,
+                        self.block_szs[i], self.block_szs[i+1], l,
+                        1 if i==0 else 2, self.sa if i==0 else False))
+                  for i,l in enumerate(self.layers)]
+        return nn.Sequential(OrderedDict(blocks))
+
+# Cell
+def _make_head(self):
+        head = [('pool', nn.AdaptiveAvgPool2d(1)),
+                ('flat', Flatten()),
+                ('fc',   nn.Linear(self.block_szs[-1]*self.expansion, self.c_out))]
+        return nn.Sequential(OrderedDict(head))
+
 # Cell
 # v8
 class Net():
@@ -83,53 +118,61 @@ def __init__(self, expansion=1, layers=[2,2,2,2], c_in=3, c_out=1000, name='Net'
         self.sa=False
         self.bn_1st = True
         self.zero_bn=True
-        self._init_cnn = init_cnn
         self.conv_layer = ConvLayer
+        self._init_cnn = init_cnn
+        self._make_stem = _make_stem
+        self._make_layer = _make_layer
+        self._make_body = _make_body
+        self._make_head = _make_head
+
 
     @property
     def block_szs(self):
         return [64//self.expansion,64,128,256,512] +[256]*(len(self.layers)-4)
 
     @property
     def stem(self):
-        return self._make_stem()
+        return self._make_stem(self)
     @property
     def head(self):
-        return self._make_head()
+        return self._make_head(self)
+#     @property
+#     def _make_layer(self):
+#         return self.__make_layer(self)
     @property
     def body(self):
-        return self._make_body()
-
-    def _make_stem(self):
-        stem = [(f"conv_{i}", self.conv_layer(self.stem_sizes[i], self.stem_sizes[i+1],
-                    stride=2 if i==0 else 1,
-                    bn_layer=(not self.stem_bn_end) if i==(len(self.stem_sizes)-2) else True,
-                    act_fn=self.act_fn, bn_1st=self.bn_1st))
-                for i in range(len(self.stem_sizes)-1)]
-        stem.append(('stem_pool', self.stem_pool))
-        if self.stem_bn_end: stem.append(('norm', self.norm(self.stem_sizes[-1])))
-        return nn.Sequential(OrderedDict(stem))
-
-    def _make_head(self):
-        head = [('pool', nn.AdaptiveAvgPool2d(1)),
-                ('flat', Flatten()),
-                ('fc',   nn.Linear(self.block_szs[-1]*self.expansion, self.c_out))]
-        return nn.Sequential(OrderedDict(head))
-
-    def _make_body(self):
-        blocks = [(f"l_{i}", self._make_layer(self.expansion,
-                        self.block_szs[i], self.block_szs[i+1], l,
-                        1 if i==0 else 2, self.sa if i==0 else False))
-                  for i,l in enumerate(self.layers)]
-        return nn.Sequential(OrderedDict(blocks))
-
-    def _make_layer(self,expansion,ni,nf,blocks,stride,sa):
-        return nn.Sequential(OrderedDict(
-            [(f"bl_{i}", self.block(expansion, ni if i==0 else nf, nf,
-                    stride if i==0 else 1, sa=sa if i==blocks-1 else False,
-                    conv_layer=self.conv_layer, act_fn=self.act_fn, pool=self.pool,
-                                    zero_bn=self.zero_bn, bn_1st=self.bn_1st))
-              for i in range(blocks)]))
+        return self._make_body(self)
+
+#     def _make_stem(self):
+#         stem = [(f"conv_{i}", self.conv_layer(self.stem_sizes[i], self.stem_sizes[i+1],
+#                     stride=2 if i==0 else 1,
+#                     bn_layer=(not self.stem_bn_end) if i==(len(self.stem_sizes)-2) else True,
+#                     act_fn=self.act_fn, bn_1st=self.bn_1st))
+#                 for i in range(len(self.stem_sizes)-1)]
+#         stem.append(('stem_pool', self.stem_pool))
+#         if self.stem_bn_end: stem.append(('norm', self.norm(self.stem_sizes[-1])))
+#         return nn.Sequential(OrderedDict(stem))
+
+#     def _make_head(self):
+#         head = [('pool', nn.AdaptiveAvgPool2d(1)),
+#                 ('flat', Flatten()),
+#                 ('fc',   nn.Linear(self.block_szs[-1]*self.expansion, self.c_out))]
+#         return nn.Sequential(OrderedDict(head))
+
+#     def _make_body(self):
+#         blocks = [(f"l_{i}", self._make_layer(self.expansion,
+#                         self.block_szs[i], self.block_szs[i+1], l,
+#                         1 if i==0 else 2, self.sa if i==0 else False))
+#                   for i,l in enumerate(self.layers)]
+#         return nn.Sequential(OrderedDict(blocks))
+
+#     def _make_layer(self,expansion,ni,nf,blocks,stride,sa):
+#         return nn.Sequential(OrderedDict(
+#             [(f"bl_{i}", self.block(expansion, ni if i==0 else nf, nf,
+#                     stride if i==0 else 1, sa=sa if i==blocks-1 else False,
+#                     conv_layer=self.conv_layer, act_fn=self.act_fn, pool=self.pool,
+#                                     zero_bn=self.zero_bn, bn_1st=self.bn_1st))
+#               for i in range(blocks)]))
 
     def __call__(self):
         model = nn.Sequential(OrderedDict([
diff --git a/nbs/04_Net.ipynb b/nbs/04_Net.ipynb
@@ -342,6 +342,76 @@
     "assert y.shape == torch.Size([bs_test, 512, 16, 16]), f\"size\""
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# Stem, Body, Head"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# export\n",
+    "def _make_stem(self):\n",
+    "        stem = [(f\"conv_{i}\", self.conv_layer(self.stem_sizes[i], self.stem_sizes[i+1], \n",
+    "                    stride=2 if i==0 else 1, \n",
+    "                    bn_layer=(not self.stem_bn_end) if i==(len(self.stem_sizes)-2) else True,\n",
+    "                    act_fn=self.act_fn, bn_1st=self.bn_1st))\n",
+    "                for i in range(len(self.stem_sizes)-1)]\n",
+    "        stem.append(('stem_pool', self.stem_pool))\n",
+    "        if self.stem_bn_end: stem.append(('norm', self.norm(self.stem_sizes[-1])))\n",
+    "        return nn.Sequential(OrderedDict(stem))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# export\n",
+    "def _make_layer(self,expansion,ni,nf,blocks,stride,sa):\n",
+    "        return nn.Sequential(OrderedDict(\n",
+    "            [(f\"bl_{i}\", self.block(expansion, ni if i==0 else nf, nf, \n",
+    "                    stride if i==0 else 1, sa=sa if i==blocks-1 else False,\n",
+    "                    conv_layer=self.conv_layer, act_fn=self.act_fn, pool=self.pool,\n",
+    "                                    zero_bn=self.zero_bn, bn_1st=self.bn_1st))\n",
+    "              for i in range(blocks)]))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# export\n",
+    "def _make_body(self):\n",
+    "        blocks = [(f\"l_{i}\", self._make_layer(self,self.expansion, \n",
+    "                        self.block_szs[i], self.block_szs[i+1], l, \n",
+    "                        1 if i==0 else 2, self.sa if i==0 else False))\n",
+    "                  for i,l in enumerate(self.layers)]\n",
+    "        return nn.Sequential(OrderedDict(blocks))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# export\n",
+    "def _make_head(self):\n",
+    "        head = [('pool', nn.AdaptiveAvgPool2d(1)),\n",
+    "                ('flat', Flatten()),\n",
+    "                ('fc',   nn.Linear(self.block_szs[-1]*self.expansion, self.c_out))]\n",
+    "        return nn.Sequential(OrderedDict(head))"
+   ]
+  },
   {
    "cell_type": "markdown",
    "metadata": {},
@@ -372,53 +442,61 @@
     "        self.sa=False\n",
     "        self.bn_1st = True\n",
     "        self.zero_bn=True\n",
-    "        self._init_cnn = init_cnn\n",
     "        self.conv_layer = ConvLayer\n",
+    "        self._init_cnn = init_cnn\n",
+    "        self._make_stem = _make_stem\n",
+    "        self._make_layer = _make_layer\n",
+    "        self._make_body = _make_body\n",
+    "        self._make_head = _make_head\n",
+    "        \n",
     "        \n",
     "    @property\n",
     "    def block_szs(self):\n",
     "        return [64//self.expansion,64,128,256,512] +[256]*(len(self.layers)-4) \n",
     "\n",
     "    @property\n",
     "    def stem(self):\n",
-    "        return self._make_stem()\n",
+    "        return self._make_stem(self)\n",
     "    @property\n",
     "    def head(self):\n",
-    "        return self._make_head()\n",
+    "        return self._make_head(self)\n",
+    "#     @property\n",
+    "#     def _make_layer(self):\n",
+    "#         return self.__make_layer(self)\n",
     "    @property\n",
     "    def body(self):\n",
-    "        return self._make_body()\n",
+    "        return self._make_body(self)\n",
     "    \n",
-    "    def _make_stem(self):\n",
-    "        stem = [(f\"conv_{i}\", self.conv_layer(self.stem_sizes[i], self.stem_sizes[i+1], \n",
-    "                    stride=2 if i==0 else 1, \n",
-    "                    bn_layer=(not self.stem_bn_end) if i==(len(self.stem_sizes)-2) else True,\n",
-    "                    act_fn=self.act_fn, bn_1st=self.bn_1st))\n",
-    "                for i in range(len(self.stem_sizes)-1)]\n",
-    "        stem.append(('stem_pool', self.stem_pool))\n",
-    "        if self.stem_bn_end: stem.append(('norm', self.norm(self.stem_sizes[-1])))\n",
-    "        return nn.Sequential(OrderedDict(stem))\n",
+    "#     def _make_stem(self):\n",
+    "#         stem = [(f\"conv_{i}\", self.conv_layer(self.stem_sizes[i], self.stem_sizes[i+1], \n",
+    "#                     stride=2 if i==0 else 1, \n",
+    "#                     bn_layer=(not self.stem_bn_end) if i==(len(self.stem_sizes)-2) else True,\n",
+    "#                     act_fn=self.act_fn, bn_1st=self.bn_1st))\n",
+    "#                 for i in range(len(self.stem_sizes)-1)]\n",
+    "#         stem.append(('stem_pool', self.stem_pool))\n",
+    "#         if self.stem_bn_end: stem.append(('norm', self.norm(self.stem_sizes[-1])))\n",
+    "#         return nn.Sequential(OrderedDict(stem))\n",
     "    \n",
-    "    def _make_head(self):\n",
-    "        head = [('pool', nn.AdaptiveAvgPool2d(1)),\n",
-    "                ('flat', Flatten()),\n",
-    "                ('fc',   nn.Linear(self.block_szs[-1]*self.expansion, self.c_out))]\n",
-    "        return nn.Sequential(OrderedDict(head))\n",
+    "#     def _make_head(self):\n",
+    "#         head = [('pool', nn.AdaptiveAvgPool2d(1)),\n",
+    "#                 ('flat', Flatten()),\n",
+    "#                 ('fc',   nn.Linear(self.block_szs[-1]*self.expansion, self.c_out))]\n",
+    "#         return nn.Sequential(OrderedDict(head))\n",
     "    \n",
-    "    def _make_body(self):\n",
-    "        blocks = [(f\"l_{i}\", self._make_layer(self.expansion, \n",
-    "                        self.block_szs[i], self.block_szs[i+1], l, \n",
-    "                        1 if i==0 else 2, self.sa if i==0 else False))\n",
-    "                  for i,l in enumerate(self.layers)]\n",
-    "        return nn.Sequential(OrderedDict(blocks))\n",
+    "#     def _make_body(self):\n",
+    "#         blocks = [(f\"l_{i}\", self._make_layer(self.expansion, \n",
+    "#                         self.block_szs[i], self.block_szs[i+1], l, \n",
+    "#                         1 if i==0 else 2, self.sa if i==0 else False))\n",
+    "#                   for i,l in enumerate(self.layers)]\n",
+    "#         return nn.Sequential(OrderedDict(blocks))\n",
     "    \n",
-    "    def _make_layer(self,expansion,ni,nf,blocks,stride,sa):\n",
-    "        return nn.Sequential(OrderedDict(\n",
-    "            [(f\"bl_{i}\", self.block(expansion, ni if i==0 else nf, nf, \n",
-    "                    stride if i==0 else 1, sa=sa if i==blocks-1 else False,\n",
-    "                    conv_layer=self.conv_layer, act_fn=self.act_fn, pool=self.pool,\n",
-    "                                    zero_bn=self.zero_bn, bn_1st=self.bn_1st))\n",
-    "              for i in range(blocks)]))\n",
+    "#     def _make_layer(self,expansion,ni,nf,blocks,stride,sa):\n",
+    "#         return nn.Sequential(OrderedDict(\n",
+    "#             [(f\"bl_{i}\", self.block(expansion, ni if i==0 else nf, nf, \n",
+    "#                     stride if i==0 else 1, sa=sa if i==blocks-1 else False,\n",
+    "#                     conv_layer=self.conv_layer, act_fn=self.act_fn, pool=self.pool,\n",
+    "#                                     zero_bn=self.zero_bn, bn_1st=self.bn_1st))\n",
+    "#               for i in range(blocks)]))\n",
     "    \n",
     "    def __call__(self):\n",
     "        model = nn.Sequential(OrderedDict([\n",