16 changed files with 34 additions and 144 deletions
--- a/9
+++ b/9
@ -1,7 +1,7 @@
 # AstrAI Dockerfile - Multi-stage Build (Optimized)

 # Build stage - use base image with minimal build tools
-FROM ubuntu:24.04 AS builder
+FROM nvidia/cuda:12.6.0-base-ubuntu24.04 AS builder

 WORKDIR /app

@ -18,7 +18,7 @@ RUN apt-get update && DEBIAN_FRONTEND=noninteractive apt-get install -y --no-ins
 RUN python3.12 -m venv --copies /opt/venv
 ENV PATH="/opt/venv/bin:$PATH"

-# Copy source code and install (deps read from pyproject.toml)
+# Copy source code and install dependencies
 COPY astrai/ ./astrai/
 COPY pyproject.toml .
 RUN pip install --no-cache-dir --upgrade pip \
@ -26,14 +26,13 @@ RUN pip install --no-cache-dir --upgrade pip \
    --extra-index-url https://download.pytorch.org/whl/cu126

 # Production stage
-FROM ubuntu:24.04 AS production
+FROM nvidia/cuda:12.6.0-base-ubuntu24.04 AS production

 WORKDIR /app

-# Install Python 3.12 runtime and healthcheck dependency
+# Install Python 3.12 runtime
 RUN apt-get update && DEBIAN_FRONTEND=noninteractive apt-get install -y --no-install-recommends \
    python3.12 \
-    curl \
    && rm -rf /var/lib/apt/lists/*

 # Copy virtual environment from builder
--- a/README.md
+++ b/README.md
@ -213,7 +213,7 @@ python scripts/demo/generate_batch.py
 python scripts/demo/generate_ar.py
 ```

-Watch a video walkthrough on [bilibili](https://www.bilibili.com/video/BV1fuLB6yEj6).
+Watch a video walkthrough on [bilibili](https://www.bilibili.com/video/BV1z5RPYHEkd).

 ### Documentation

--- a/assets/docs/README-zh-CN.md
+++ b/assets/docs/README-zh-CN.md
@ -219,7 +219,7 @@ python scripts/demo/generate_batch.py
 python scripts/demo/generate_ar.py
 ```

-观看 [bilibili](https://www.bilibili.com/video/BV1fuLB6yEj6) 上的视频演示。
+观看 [bilibili](https://www.bilibili.com/video/BV1z5RPYHEkd) 上的视频演示。

 ### 文档

--- a/assets/docs/architecture.md
+++ b/assets/docs/architecture.md
@ -77,9 +77,6 @@ classDiagram
            +int start_batch
            +str ckpt_dir
            +int ckpt_interval
-            +str log_dir
-            +int log_interval
-            +List[str] metrics
            +int random_seed
            +int num_workers
            +Optional[int] prefetch_factor
@ -475,10 +472,6 @@ classDiagram
        class CheckpointCallback {
            +str save_dir
            +int interval
-            +bool weight_only
-            +Callable state_dict_fn
-            +Callable save_extra_fn
-            +Callable load_extra_fn
            +_save_checkpoint(context)
            +on_train_begin(context)
            +on_batch_end(context)
@ -490,8 +483,6 @@ classDiagram

        class ProgressBarCallback {
            +int num_epoch
-            +int log_interval
-            +IO file
            +on_epoch_begin(context)
            +on_batch_end(context)
            +on_epoch_end(context)
@ -500,8 +491,6 @@ classDiagram
        class MetricLoggerCallback {
            +str log_dir
            +int save_interval
-            +int log_interval
-            +List[str] metrics
            +on_batch_end(context)
            +on_train_end(context)
            +on_error(context)
@ -698,7 +687,7 @@ classDiagram
        }

        class SamplingPipeline {
-            +List[BaseSamplingStrategy] strategies
+            +List strategies
            +apply(logits, filter_value) Tensor
            +sample(logits, filter_value) Tensor
        }
@ -722,16 +711,16 @@ classDiagram
        class ChatCompletionRequest {
            +str model
            +List[ChatMessage] messages
-            +Optional[float] temperature
-            +Optional[float] top_p
-            +Optional[int] top_k
-            +Optional[int] max_tokens
-            +Optional[bool] stream
+            +float temperature
+            +float top_p
+            +int top_k
+            +int max_tokens
+            +bool stream
            +Optional[Union[str, List[str]]] stop
            +Optional[int] n
            +Optional[float] presence_penalty
            +Optional[float] frequency_penalty
-            +Optional[Dict[int, float]] logit_bias
+            +Optional[Dict] logit_bias
            +Optional[str] user
        }

@ -883,6 +872,7 @@ classDiagram
    InferenceScheduler *-- KVCache
    InferenceScheduler *-- Executor
    InferenceScheduler *-- TaskManager
+    SamplingPipeline *-- BaseSamplingStrategy
    AutoRegressiveLM *-- DecoderBlock
    AutoRegressiveLM *-- RotaryEmbedding
    AutoRegressiveLM *-- Embedding
@ -890,10 +880,9 @@ classDiagram
    EmbeddingEncoder *-- RotaryEmbedding
    EmbeddingEncoder *-- Embedding
    DecoderBlock *-- RMSNorm
+    BaseDataset o-- BaseStorage
    ChatCompletionRequest *-- ChatMessage
    MessagesRequest *-- AnthropicMessage
-    AutoTokenizer *-- ChatTemplate
-    BaseFactory *-- Registry

    %% --- Aggregation (weak ownership) ---
    AutoModel o-- BaseModelConfig
@ -901,9 +890,9 @@ classDiagram
    TrainContext o-- BaseStrategy
    TrainContext o-- BaseScheduler
    TrainContext o-- Checkpoint
+    AutoTokenizer o-- ChatTemplate
    KvcacheView o-- Storage
-    SamplingPipeline o-- BaseSamplingStrategy
-    BaseDataset o-- BaseStorage
+    BaseFactory o-- Registry

    %% --- Dependency (uses temporarily) ---
    TrainConfig ..> BaseStrategy : selects
--- a/astrai/init.py
+++ b/astrai/init.py
@ -1,4 +1,4 @@
-__version__ = "1.3.6"
+__version__ = "1.3.5"
 __author__ = "ViperEkura"

 from astrai.config import (
--- a/astrai/config/init.py
+++ b/astrai/config/init.py
@ -11,6 +11,7 @@ __all__ = [
    "BaseModelConfig",
    "AutoRegressiveLMConfig",
    "EncoderConfig",
+    "ModelConfig",
    "ConfigFactory",
    "TrainConfig",
 ]
--- a/astrai/config/base.py
+++ b/astrai/config/base.py
@ -13,7 +13,7 @@ class BaseConfig:
                d[fld.name] = v
            elif v is None:
                d[fld.name] = None
-            elif isinstance(v, (dict, list)):
+            elif isinstance(v, dict):
                try:
                    json.dumps(v)
                    d[fld.name] = v
--- a/astrai/config/train_config.py
+++ b/astrai/config/train_config.py
@ -1,5 +1,5 @@
 from dataclasses import dataclass, field, fields
-from typing import Callable, List, Optional
+from typing import Callable, Optional

 import torch.nn as nn
 from torch.optim import Optimizer
@ -56,19 +56,6 @@ class TrainConfig(BaseConfig):
        default=5000, metadata={"help": "Number of iterations between checkpoints."}
    )

-    # metric setting
-    log_dir: str = field(
-        default="./checkpoint/logs", metadata={"help": "Directory for metric logs."}
-    )
-    log_interval: int = field(
-        default=100,
-        metadata={"help": "Number of batch iterations between metric logs."},
-    )
-    metrics: List[str] = field(
-        default_factory=lambda: ["loss", "lr"],
-        metadata={"help": "Metrics to record during training."},
-    )
-
    # dataloader setting
    random_seed: int = field(default=3407, metadata={"help": "Random seed."})
    num_workers: int = field(
--- a/astrai/inference/api/protocol.py
+++ b/astrai/inference/api/protocol.py
@ -226,17 +226,6 @@ class OpenAIHandler(ProtocolHandler):
    def create_response_id(self) -> str:
        return f"chatcmpl-{uuid.uuid4().hex[:12]}"

-    def get_stop_sequences(self) -> List[str]:
-        stop = self.request.stop
-        if stop is None:
-            return []
-        return [stop] if isinstance(stop, str) else stop
-
-    def on_token(
-        self, ctx: StreamContext, token: str, stop_checker: StopChecker
-    ) -> Optional[str]:
-        return stop_checker.check(ctx.accumulated)
-
    def format_stream_start(self, ctx: StreamContext) -> List[str]:
        return [
            _sse_event(
--- a/astrai/parallel/setup.py
+++ b/astrai/parallel/setup.py
@ -163,4 +163,5 @@ def spawn_parallel_fn(
        nprocs=world_size,
        start_method=start_method,
        join=True,
+        daemon=True,
    )
--- a/astrai/serialization.py
+++ b/astrai/serialization.py
@ -38,7 +38,7 @@ class Checkpoint:
            meta = {
                "epoch": self.epoch,
                "iteration": self.iteration,
-                "timestamp": time.strftime("%Y-%m-%dT%H:%M:%S"),
+                "timestamp": time.time(),
            }
            meta.update(self.meta)
            with open(save_path / "meta.json", "w") as f:
--- a/astrai/trainer/train_callback.py
+++ b/astrai/trainer/train_callback.py
@ -1,10 +1,9 @@
 import json
 import logging
 import os
-import sys
 import time
 from pathlib import Path
-from typing import IO, Callable, List, Optional, Protocol, runtime_checkable
+from typing import Callable, List, Optional, Protocol, runtime_checkable

 import torch
 import torch.distributed as dist
@ -212,12 +211,8 @@ class ProgressBarCallback(TrainCallback):
    Progress bar callback for trainer.
    """

-    def __init__(
-        self, num_epoch: int, log_interval: int = 100, file: IO[str] = sys.stdout
-    ):
+    def __init__(self, num_epoch: int):
        self.num_epoch = num_epoch
-        self.log_interval = log_interval
-        self.file = file
        self.progress_bar: tqdm = None

    @only_on_rank(0)
@ -226,7 +221,6 @@ class ProgressBarCallback(TrainCallback):
            context.dataloader,
            desc=f"Epoch {context.epoch + 1}/{self.num_epoch}",
            dynamic_ncols=True,
-            file=self.file,
        )

    @only_on_rank(0)
@ -280,7 +274,7 @@ class MetricLoggerCallback(TrainCallback):

    def _get_log_data(self, context: TrainContext):
        return {
-            "timestamp": time.strftime("%Y-%m-%dT%H:%M:%S"),
+            "timestamp": time.strftime("%Y-%m-%d %H:%M:%S"),
            "epoch": context.epoch,
            "iter": context.iteration,
            **{m: self._metric_funcs[m](context) for m in self.metrics},
--- a/astrai/trainer/trainer.py
+++ b/astrai/trainer/trainer.py
@ -36,14 +36,8 @@ class Trainer:
                cfg.ckpt_interval,
                state_dict_fn=cfg.state_dict_fn,
            ),
-            CallbackFactory.create(
-                "metric_logger",
-                log_dir=cfg.log_dir,
-                save_interval=cfg.ckpt_interval,
-                log_interval=cfg.log_interval,
-                metrics=cfg.metrics,
-            ),
            CallbackFactory.create("progress_bar", cfg.n_epoch),
+            CallbackFactory.create("metric_logger", cfg.ckpt_dir, cfg.ckpt_interval),
            CallbackFactory.create("gradient_clipping", cfg.max_grad_norm),
            CallbackFactory.create("validation"),
        ]
--- a/docker-compose.yml
+++ b/docker-compose.yml
@ -1,13 +1,12 @@
 services:
  server:
-    build:
-      context: .
-      dockerfile: Dockerfile
-    user: "${UID:-1000}:${GID:-1000}"
+    build: .
+    image: astrai:latest
    ports:
      - "8000:8000"
    volumes:
      - ./params:/app/params:ro
+      - ./checkpoints:/app/checkpoints
    command: python -m scripts.tools.server --port 8000 --device cuda
    deploy:
      resources:
@ -26,14 +25,13 @@ services:

  server-cpu:
    profiles: [cpu]
-    build:
-      context: .
-      dockerfile: Dockerfile
-    user: "${UID:-1000}:${GID:-1000}"
+    build: .
+    image: astrai:latest
    ports:
      - "8000:8000"
    volumes:
      - ./params:/app/params:ro
+      - ./checkpoints:/app/checkpoints
    command: python -m scripts.tools.server --port 8000 --device cpu
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8000/health"]
--- a/scripts/docker.sh
+++ b/scripts/docker.sh
@ -16,7 +16,6 @@ NC='\033[0m' # No Color
 IMAGE_NAME="astrai"
 IMAGE_TAG="latest"
 REGISTRY=""
-CONTAINER_ID=""

 # Print colored messages
 print_info() {
@ -176,10 +175,6 @@ main() {
                PORT="$2"
                shift 2
                ;;
-            --container)
-                CONTAINER_ID="$2"
-                shift 2
-                ;;
            --gpu)
                GPU=true
                shift
@ -202,7 +197,6 @@ main() {
                echo "  --dockerfile FILE  Dockerfile path (default: Dockerfile)"
                echo "  --context PATH     Build context (default: .)"
                echo "  --port PORT        Port for run (default: 8000)"
-                echo "  --container ID     Container ID for logs"
                echo "  --gpu              Enable GPU support"
                echo "  --help             Show this help message"
                echo ""
@ -211,7 +205,6 @@ main() {
                echo "  $0 build --tag v1.0.0"
                echo "  $0 run --port 8080"
                echo "  $0 run --gpu"
-                echo "  $0 logs --container abc123"
                echo "  $0 push --registry ghcr.io/username"
                exit 0
                ;;
@ -244,7 +237,7 @@ main() {
            show_info
            ;;
        logs)
-            show_logs "$CONTAINER_ID"
+            show_logs "$2"
            ;;
        "")
            print_error "No command specified. Use --help for usage"
--- a/tests/inference/test_server.py
+++ b/tests/inference/test_server.py
@ -157,60 +157,5 @@ def test_messages_with_system(client, loaded_model):
    assert data["type"] == "message"


-def test_chat_completions_stop_sequence(client, loaded_model):
-    """POST /v1/chat/completions with stop parameter truncates at stop sequence."""
-
-    async def async_gen():
-        yield "Hello"
-        yield "X"
-        yield "world"
-
-    app.state.engine = loaded_model
-    loaded_model.generate_async.return_value = async_gen()
-    response = client.post(
-        "/v1/chat/completions",
-        json={
-            "messages": [{"role": "user", "content": "Hello"}],
-            "max_tokens": 100,
-            "stream": False,
-            "stop": ["X"],
-        },
-    )
-    assert response.status_code == 200
-    data = response.json()
-    content = data["choices"][0]["message"]["content"]
-    assert "X" in content
-    assert "world" not in content
-
-
-def test_chat_completions_stop_sequence_stream(client, loaded_model):
-    """POST /v1/chat/completions with stop parameter truncates SSE stream."""
-
-    async def async_gen():
-        yield "Hello"
-        yield "X"
-        yield "world"
-
-    app.state.engine = loaded_model
-    loaded_model.generate_async.return_value = async_gen()
-    response = client.post(
-        "/v1/chat/completions",
-        json={
-            "messages": [{"role": "user", "content": "Hello"}],
-            "max_tokens": 100,
-            "stream": True,
-            "stop": ["X"],
-        },
-        headers={"Accept": "text/event-stream"},
-    )
-    assert response.status_code == 200
-    content = response.content.decode("utf-8")
-    assert "Hello" in content
-    assert "world" not in content
-    assert any(
-        "finish_reason" in line for line in content.split("\n") if "stop" in line
-    )
-
-
 if __name__ == "__main__":
    pytest.main([__file__, "-v"])