Spaces:

innnky
/

visinger2-nomidi

Build error

innnky commited on Jan 17, 2023

Commit

e306eaf

•

1 Parent(s): 8f5da61

init

Files changed (2) hide show

app.py CHANGED Viewed

@@ -41,12 +41,13 @@ def vc_fn(speaker, ds, vc_transform):
             ph_dur= [float(i) for i in ph_dur.split(" ")]
             f0_seq = [float(i) for i in f0_seq.split(" ")]
             dur+=sum(ph_dur)
-            if sum(ph_dur) >30:
                 flag = True
     except:
         return "ds工程需要冻结f0和音素参数才能使用此模型合成", None
     if flag:
-        return "单个切片时长必须小于30s，否则请使用本地推理", None
     if dur>120:
         return "总时长需要小于2分钟，否则请使用本地推理", None
     out_audio = infer_ds(net_g, hps, ds, speaker, vc_transform)
@@ -69,7 +70,7 @@ with app:
                 由于此模型是nomidi模型，因此导出ds工程时需要冻结音素和音高参数, 否则会报错，具体DiffSinger工程制作详细问题可以加入DiffSinger QQ交流群 907879266
-                在线推理限制为总时长小于2分钟，且单个切片时长小于30s，有更大需求请下载本仓库或github仓库代码运行ds_inference.py进行本地推理
                 """)
             sid = gr.Dropdown(label="音色", choices=["taffy", "otto"], value="taffy")
             vc_input3 = gr.TextArea(label="ds工程（json格式）",value='''[

             ph_dur= [float(i) for i in ph_dur.split(" ")]
             f0_seq = [float(i) for i in f0_seq.split(" ")]
             dur+=sum(ph_dur)
+            print(sum(ph_dur))
+            if sum(ph_dur) >20:
                 flag = True
     except:
         return "ds工程需要冻结f0和音素参数才能使用此模型合成", None
     if flag:
+        return "单个切片时长必须小于20s，否则请使用本地推理", None
     if dur>120:
         return "总时长需要小于2分钟，否则请使用本地推理", None
     out_audio = infer_ds(net_g, hps, ds, speaker, vc_transform)
                 由于此模型是nomidi模型，因此导出ds工程时需要冻结音素和音高参数, 否则会报错，具体DiffSinger工程制作详细问题可以加入DiffSinger QQ交流群 907879266
+                在线推理限制为总时长小于2分钟，且单个切片时长小于20s，有更大需求请下载本仓库或github仓库代码运行ds_inference.py进行本地推理
                 """)
             sid = gr.Dropdown(label="音色", choices=["taffy", "otto"], value="taffy")
             vc_input3 = gr.TextArea(label="ds工程（json格式）",value='''[

infer/__init__.py CHANGED Viewed

@@ -112,6 +112,7 @@ def infer_ds(model, hps, ds, speaker, trans):
             result = cross_fade(result, seg_audio, current_length + silent_length)
         current_length = current_length + silent_length + seg_audio.shape[0]
         print("infer time:", time.time() - t1)
     return result

             result = cross_fade(result, seg_audio, current_length + silent_length)
         current_length = current_length + silent_length + seg_audio.shape[0]
         print("infer time:", time.time() - t1)
     return result