Upload with huggingface_hub

Browse files

Files changed (4) hide show

README.md +6 -9
config.json +1 -1
pytorch_model.bin +1 -1
tokenizer_config.json +1 -1

README.md CHANGED Viewed

@@ -2,16 +2,14 @@
 pipeline_tag: sentence-similarity
 tags:
 - sentence-transformers
 - sentence-similarity
 - transformers
-- TAACO
-language: ko
 ---
-# TAACO_Sentence_Similarity
-This is a Sentence_Similarity of TAACO with [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 768 dimensional dense vector space and can be used for tasks like clustering or semantic search.
 <!--- Describe your model here -->
@@ -55,9 +53,8 @@ def mean_pooling(model_output, attention_mask):
 sentences = ['This is an example sentence', 'Each sentence is converted']
 # Load model from HuggingFace Hub
-tokenizer = AutoTokenizer.from_pretrained("KDHyun08/TAACO_STS")
-model = AutoModel.from_pretrained("KDHyun08/TAACO_STS")
 # Tokenize sentences
 encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')
@@ -87,7 +84,7 @@ The model was trained with the parameters:
 **DataLoader**:
-`torch.utils.data.dataloader.DataLoader` of length 365 with parameters:
 ```
 {'batch_size': 32, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}
 ```

 pipeline_tag: sentence-similarity
 tags:
 - sentence-transformers
+- feature-extraction
 - sentence-similarity
 - transformers
 ---
+# {MODEL_NAME}
+This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 768 dimensional dense vector space and can be used for tasks like clustering or semantic search.
 <!--- Describe your model here -->
 sentences = ['This is an example sentence', 'Each sentence is converted']
 # Load model from HuggingFace Hub
+tokenizer = AutoTokenizer.from_pretrained('{MODEL_NAME}')
+model = AutoModel.from_pretrained('{MODEL_NAME}')
 # Tokenize sentences
 encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')
 **DataLoader**:
+`torch.utils.data.dataloader.DataLoader` of length 142 with parameters:
 ```
 {'batch_size': 32, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}
 ```

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "klue/bert-base",
   "architectures": [
     "BertModel"
   ],

 {
+  "_name_or_path": "C:\\Users\\DESKTOP/.cache\\torch\\sentence_transformers\\KDHyun08_TAACO_STS\\",
   "architectures": [
     "BertModel"
   ],

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:692467d733c2b6171f65825fb19735984090afc43bea3b8b5f4829e8a83f5242
 size 442543599

 version https://git-lfs.github.com/spec/v1
+oid sha256:fc7bbf7951004b83a5907a98ce803a92b540f1a522e429aadb7b56fa079da210
 size 442543599

tokenizer_config.json CHANGED Viewed

@@ -1 +1 @@

- {"do_lower_case": false, "unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]", "tokenize_chinese_chars": true, "strip_accents": null, "do_basic_tokenize": true, "never_split": null, "model_max_length": 512, "special_tokens_map_file": "C:\\Users\\DESKTOP/.cache\\huggingface\\transformers\\aeaaa3afd086a040be912f92ffe7b5f85008b744624f4517c4216bcc32b51cf0.054ece8d16bd524c8a00f0e8a976c00d5de22a755ffb79e353ee2954d9289e26", "name_or_path": "~~klue/bert-base~~", "tokenizer_class": "BertTokenizer"}

+ {"do_lower_case": false, "unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]", "tokenize_chinese_chars": true, "strip_accents": null, "do_basic_tokenize": true, "never_split": null, "model_max_length": 512, "special_tokens_map_file": "C:\\Users\\DESKTOP/.cache\\huggingface\\transformers\\aeaaa3afd086a040be912f92ffe7b5f85008b744624f4517c4216bcc32b51cf0.054ece8d16bd524c8a00f0e8a976c00d5de22a755ffb79e353ee2954d9289e26", "name_or_path": "C:\\Users\\DESKTOP/.cache\\torch\\sentence_transformers\\KDHyun08_TAACO_STS\\", "tokenizer_class": "BertTokenizer"}