fix rmsnorm init weight bug. (#59)

- fix rmsnorm init weight bug. (9d3d7be563d07295abb119ff28714aa9267580b8)

Co-authored-by: Ben <Shan1990@users.noreply.huggingface.co>

Files changed (1) hide show

modeling_chatglm.py CHANGED Viewed

@@ -181,7 +181,7 @@ def apply_rotary_pos_emb(x: torch.Tensor, rope_cache: torch.Tensor) -> torch.Ten
 class RMSNorm(torch.nn.Module):
     def __init__(self, normalized_shape, eps=1e-5, device=None, dtype=None, **kwargs):
         super().__init__()
-        self.weight = torch.nn.Parameter(torch.empty(normalized_shape, device=device, dtype=dtype))
         self.eps = eps
     def forward(self, hidden_states: torch.Tensor):

 class RMSNorm(torch.nn.Module):
     def __init__(self, normalized_shape, eps=1e-5, device=None, dtype=None, **kwargs):
         super().__init__()
+        self.weight = torch.nn.Parameter(torch.ones(normalized_shape, device=device, dtype=dtype))
         self.eps = eps
     def forward(self, hidden_states: torch.Tensor):