GPalomeque commited on
Commit
6ba88a5
1 Parent(s): 9daa491

Update app_details.py

Browse files
Files changed (1) hide show
  1. app_details.py +8 -1
app_details.py CHANGED
@@ -50,7 +50,14 @@ entrenados para el hackathon por el equipo compuesto por: gpalomeque, aureliopvs
50
  """
51
 
52
  article='''
53
- ### Retos
 
 
 
 
 
 
 
54
 
55
  ### Team
56
 
 
50
  """
51
 
52
  article='''
53
+ El principal problema de entrenar modelos que pretenezcan a un dominio especializado como el **jurídico** que ademas sea en **español** se centra en la construcción de los **datasets** por la practicamente inexistencia de los mismos.
54
+
55
+ Es por ello que tuvimos que crear dos datasets:
56
+
57
+ - [scjnugacj/scjn_dataset_corpus_tesis] (https://huggingface.co/datasets/scjnugacj/scjn_dataset_corpus_tesis) la información base fue obtenida del **[Buscador Juridico de la SCJN de México]** (https://bj.scjn.gob.mx/) utilizando como fuente de información: Tesis y filtrando la información por décima y undécima epoca; sin embargo, fue necesario realizar procesos de ETL para la limpieza de información no relevante y estructuración de los campos
58
+ * `id`: a `string` feature.
59
+ * `text`: a `string` features.
60
+ - [scjnugacj/scjn_dataset_ner](https://huggingface.co/datasets/scjnugacj/scjn_dataset_ner)
61
 
62
  ### Team
63