increased lora capacity, more epoches, and increased max length for generated output

Ubuntu · Ubuntu · commit 7fa925f12623 · 2025-07-01T18:02:44.000Z
diff --git a/src/korea_travel_guide/inference.py b/src/korea_travel_guide/inference.py
@@ -117,9 +117,11 @@ def main():
             # fast batched generate
             out = model.generate(
                 **enc,
-                max_length=128,
-                num_beams=4,
+                max_length=1024,
+                num_beams=5,
                 early_stopping=True,
+                length_penalty=1.0,
+                repetition_penalty=1.1,
             )
 
         decoded = tok.batch_decode(out, skip_special_tokens=True)
diff --git a/src/korea_travel_guide/model.py b/src/korea_travel_guide/model.py
@@ -16,7 +16,7 @@ def build_peft_model(
     lora_alpha: int = 16,
     lora_dropout: float = 0.1,
     bias: str = "none",
-    target_modules: list[str] = ("q_proj", "v_proj"),
+    target_modules: list[str] = ("q_proj", "k_proj", "v_proj", "o_proj"),
     modules_to_save: list[str] = ("lm_head",),
 ) -> PeftModel:
     config = LoraConfig(
diff --git a/src/korea_travel_guide/train.py b/src/korea_travel_guide/train.py
@@ -47,12 +47,12 @@ class CustomTrainingArgs(Seq2SeqTrainingArguments):
     eval_strategy: str = "epoch"
     save_strategy: str = "epoch"
     logging_steps: int = 5
-    learning_rate: float = 3e-5
+    learning_rate: float = 1e-4
     lr_scheduler_type: str = "linear"
     warmup_ratio: float = 0.05
-    num_train_epochs: int = 5
-    per_device_train_batch_size: int = 16
-    per_device_eval_batch_size: int = 32
+    num_train_epochs: int = 6
+    per_device_train_batch_size: int = 8
+    per_device_eval_batch_size: int = 16
     max_grad_norm: float = 0.5
     # label_smoothing_factor: float = 0.1
     weight_decay: float = 0.01
@@ -68,7 +68,7 @@ class CustomTrainingArgs(Seq2SeqTrainingArguments):
     label_names: List[str] = field(default_factory=lambda: ["labels"])
 
     # additional custom args
-    peft_rank: int = field(default=8, metadata={"help": "LoRA adapter rank (r)."})
+    peft_rank: int = field(default=32, metadata={"help": "LoRA adapter rank (r)."})
     hf_hub_repo_id: str | None = None
     run_test: bool = field(
         default=False,