ayasyrev
diff --git a/‎00_constructor.ipynb‎
Lines changed: 54 additions & 137 deletions b/‎00_constructor.ipynb‎
Lines changed: 54 additions & 137 deletions
@@ -38,7 +38,8 @@
     "# export\n",
     "import torch.nn as nn\n",
     "import torch\n",
-    "from collections import OrderedDict"
+    "from collections import OrderedDict\n",
+    "from model_constructor.layers import *"
    ]
   },
   {
@@ -47,150 +48,66 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "test_eq(1, 1**2)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "# test_eq(1, 2)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "# Base ConvLayer"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "# export\n",
-    "_act_fn = nn.ReLU(inplace=True)\n",
+    "# _act_fn = nn.ReLU(inplace=True)\n",
     "\n",
-    "class ConvLayer(nn.Sequential):\n",
-    "    \"\"\"Basic conv layers block\"\"\"\n",
-    "    def __init__(self, ni, nf, ks=3, stride=1, \n",
-    "            act=True,  act_fn=_act_fn, \n",
-    "            bn_layer=True, bn_1st=False, zero_bn=False, \n",
-    "            padding=None, bias=True, groups=1):\n",
+    "# class ConvLayer(nn.Sequential):\n",
+    "#     \"\"\"Basic conv layers block\"\"\"\n",
+    "#     def __init__(self, ni, nf, ks=3, stride=1, \n",
+    "#             act=True,  act_fn=_act_fn, \n",
+    "#             bn_layer=True, bn_1st=False, zero_bn=False, \n",
+    "#             padding=None, bias=True, groups=1):\n",
     "\n",
-    "        self.act = act\n",
-    "        if padding==None: padding = ks//2  \n",
-    "        layers = [('conv', nn.Conv2d(ni, nf, ks, stride=stride, padding=padding, bias=bias, groups=groups))]\n",
-    "        act_bn = [('act_fn', act_fn)] if act else []\n",
-    "        if bn_layer:\n",
-    "            bn = nn.BatchNorm2d(nf)\n",
-    "            nn.init.constant_(bn.weight, 0. if zero_bn else 1.) \n",
-    "            act_bn += [('bn', bn)]\n",
-    "        if bn_1st: act_bn.reverse()\n",
-    "        layers += act_bn\n",
-    "        super().__init__(OrderedDict(layers))"
+    "#         self.act = act\n",
+    "#         if padding==None: padding = ks//2  \n",
+    "#         layers = [('conv', nn.Conv2d(ni, nf, ks, stride=stride, padding=padding, bias=bias, groups=groups))]\n",
+    "#         act_bn = [('act_fn', act_fn)] if act else []\n",
+    "#         if bn_layer:\n",
+    "#             bn = nn.BatchNorm2d(nf)\n",
+    "#             nn.init.constant_(bn.weight, 0. if zero_bn else 1.) \n",
+    "#             act_bn += [('bn', bn)]\n",
+    "#         if bn_1st: act_bn.reverse()\n",
+    "#         layers += act_bn\n",
+    "#         super().__init__(OrderedDict(layers))"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
    "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "ConvLayer(\n",
-       "  (conv): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))\n",
-       "  (act_fn): ReLU(inplace=True)\n",
-       "  (bn): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
-       ")"
-      ]
-     },
-     "execution_count": null,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
+   "outputs": [],
    "source": [
-    "conv_layer = ConvLayer(32, 64)\n",
-    "conv_layer"
+    "# conv_layer = ConvLayer(32, 64)\n",
+    "# conv_layer"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
    "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "ConvLayer(\n",
-       "  (conv): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))\n",
-       "  (bn): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
-       ")"
-      ]
-     },
-     "execution_count": null,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
+   "outputs": [],
    "source": [
-    "conv_layer = ConvLayer(32, 64, act=False)\n",
-    "conv_layer"
+    "# conv_layer = ConvLayer(32, 64, act=False)\n",
+    "# conv_layer"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
    "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "ConvLayer(\n",
-       "  (conv): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))\n",
-       "  (act_fn): ReLU(inplace=True)\n",
-       ")"
-      ]
-     },
-     "execution_count": null,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
+   "outputs": [],
    "source": [
-    "conv_layer = ConvLayer(32, 64, bn_layer=False)\n",
-    "conv_layer"
+    "# conv_layer = ConvLayer(32, 64, bn_layer=False)\n",
+    "# conv_layer"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,
    "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "ConvLayer(\n",
-       "  (conv): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))\n",
-       "  (bn): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
-       "  (act_fn): ReLU(inplace=True)\n",
-       ")"
-      ]
-     },
-     "execution_count": null,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
+   "outputs": [],
    "source": [
-    "conv_layer = ConvLayer(32, 64, bn_1st=True)\n",
-    "conv_layer"
+    "# conv_layer = ConvLayer(32, 64, bn_1st=True)\n",
+    "# conv_layer"
    ]
   },
   {
@@ -206,12 +123,11 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "# export\n",
-    "class Flatten(nn.Module):\n",
-    "    '''flat x to vector'''\n",
-    "    def __init__(self):\n",
-    "        super().__init__()\n",
-    "    def forward(self, x): return x.view(x.size(0), -1)"
+    "# class Flatten(nn.Module):\n",
+    "#     '''flat x to vector'''\n",
+    "#     def __init__(self):\n",
+    "#         super().__init__()\n",
+    "#     def forward(self, x): return x.view(x.size(0), -1)"
    ]
   },
   {
@@ -220,14 +136,13 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "# export\n",
-    "class Noop(nn.Module): # alternative name Merge\n",
-    "    '''Dummy module for vizualize skip conn'''\n",
-    "    def __init__(self):\n",
-    "        super().__init__()\n",
+    "# class Noop(nn.Module): # alternative name Merge\n",
+    "#     '''Dummy module for vizualize skip conn'''\n",
+    "#     def __init__(self):\n",
+    "#         super().__init__()\n",
     "        \n",
-    "    def forward(self, x):\n",
-    "        return x"
+    "#     def forward(self, x):\n",
+    "#         return x"
    ]
   },
   {
@@ -440,7 +355,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Block"
+    "## BasicBlock"
    ]
   },
   {
@@ -452,10 +367,9 @@
     "# export\n",
     "class BasicBlock(nn.Module):\n",
     "    \"\"\"Basic block (simplified) as in pytorch resnet\"\"\"\n",
-    "    expansion = 1\n",
     "    def __init__(self, ni, nf, stride=1, bn_1st=False, zero_bn=False,\n",
     "#                  groups=1, base_width=64, dilation=1, norm_layer=None\n",
-    "                **kwargs):\n",
+    "                expansion = 1, **kwargs):\n",
     "        super().__init__()\n",
     "        self.downsample = not ni==nf or stride==2\n",
     "        self.conv = nn.Sequential(OrderedDict([\n",
@@ -464,7 +378,7 @@
     "        if self.downsample:\n",
     "            self.downsample = ConvLayer(ni, nf, ks=1, stride=stride, act=False, **kwargs)\n",
     "        self.merge = Noop()\n",
-    "        self.act_conn = _act_fn\n",
+    "        self.act_conn = act_fn\n",
     "                         \n",
     "    def forward(self, x):\n",
     "        identity = x\n",
@@ -558,7 +472,7 @@
     {
      "data": {
       "text/plain": [
-       "torch.Size([64, 64, 32, 32])"
+       "torch.Size([64, 64, 16, 16])"
       ]
      },
      "execution_count": null,
@@ -654,7 +568,7 @@
     "                 body_in=64, body_out=512, \n",
     "                 layer_szs=[64,128,256,], blocks=[2,2,2,2],\n",
     "                 expansion=1, **kwargs):  # Downsample Module as parameter\n",
-    "        layer_szs = [body_in] + layer_szs + [body_out]\n",
+    "        layer_szs = [body_in//expansion] + layer_szs + [body_out]\n",
     "        num_layers = len(layer_szs)-1\n",
     "        layers = [(f\"layer_{i}\", self._make_layer(block, layer_szs[i], layer_szs[i+1], blocks[i], 1 if i==0 else 2, **kwargs))\n",
     "                    for i in range(num_layers)]\n",
@@ -971,7 +885,8 @@
     "        # block_szs  = [64,128,128,256,256,512]\n",
     "        super().__init__(OrderedDict([\n",
     "            ('stem', stem(c_in=c_in,stem_out=body_in, **kwargs)),\n",
-    "            ('body', body(block, body_in, body_out, layer_szs=layer_szs, blocks=blocks, **kwargs)),\n",
+    "            ('body', body(block, body_in, body_out, \n",
+    "                        layer_szs=layer_szs, blocks=blocks, expansion=expansion, **kwargs)),\n",
     "            ('head', head(body_out*expansion, num_classes, **kwargs))\n",
     "            ]))\n",
     "        init_model(self)"
@@ -1919,7 +1834,8 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "# fin"
+    "# model_constructor\n",
+    "by ayasyrev"
    ]
   },
   {
@@ -1939,7 +1855,8 @@
      "output_type": "stream",
      "text": [
       "Converted 00_constructor.ipynb.\n",
-      "Converted 01_resnet.ipynb.\n",
+      "Converted 01_layers.ipynb.\n",
+      "Converted 02_resnet.ipynb.\n",
       "Converted index.ipynb.\n"
      ]
     }