Spaces:

srijaydeshpande
/

DeID

Sleeping

App Files Files Community

srijaydeshpande commited on Jun 22

Commit

33ac67b

•

1 Parent(s): 0ff9f5d

Update app.py

Browse files

Files changed (1) hide show

app.py +36 -0

app.py CHANGED Viewed

@@ -84,6 +84,10 @@ def txt_to_html(text):
 @spaces.GPU(duration=80)
 def deidentify_doc(pdftext, maxtokens, temperature, top_probability):
     llm = Llama(
         model_path="models/Meta-Llama-3-8B-Instruct.Q8_0.gguf",
         flash_attn=True,
@@ -107,11 +111,19 @@ def deidentify_doc(pdftext, maxtokens, temperature, top_probability):
     )
     output = output['choices'][0]['message']['content']
     # Remove starting header string in output
     find_index = output.find(' '.join(pdftext.split()[:3]))
     if find_index != -1:
         output = output[find_index:].strip()
     # print('---------------Remove Dates-----------------------')
     # print(output)
@@ -130,11 +142,19 @@ def deidentify_doc(pdftext, maxtokens, temperature, top_probability):
     )
     output = output['choices'][0]['message']['content']
     # Remove starting header string in output
     find_index = output.find(' '.join(pdftext.split()[:3]))
     if find_index != -1:
         output = output[find_index:].strip()
     # print('---------------Remove Addresses-----------------------')
     # print(output)
@@ -153,11 +173,19 @@ def deidentify_doc(pdftext, maxtokens, temperature, top_probability):
     )
     output = output['choices'][0]['message']['content']
     # Remove starting header string in output
     find_index = output.find(' '.join(pdftext.split()[:3]))
     if find_index != -1:
         output = output[find_index:].strip()
     # print('---------------Remove Names-----------------------')
     # print(output)
@@ -178,11 +206,19 @@ def deidentify_doc(pdftext, maxtokens, temperature, top_probability):
     )
     output = output['choices'][0]['message']['content']
     # Remove starting header string in output
     find_index = output.find(' '.join(pdftext.split()[:3]))
     if find_index != -1:
         output = output[find_index:].strip()
     # print('---------------Remove Registration Numbers-----------------------')
     # print(output)

 @spaces.GPU(duration=80)
 def deidentify_doc(pdftext, maxtokens, temperature, top_probability):
+    print('-----------------------------------------------------------')
+    print(pdftext)
+    print('-----------------------------------------------------------')
     llm = Llama(
         model_path="models/Meta-Llama-3-8B-Instruct.Q8_0.gguf",
         flash_attn=True,
     )
     output = output['choices'][0]['message']['content']
+    print('-----------------------------------------------------------')
+    print(output)
+    print('-----------------------------------------------------------')
     # Remove starting header string in output
     find_index = output.find(' '.join(pdftext.split()[:3]))
     if find_index != -1:
         output = output[find_index:].strip()
+    print('-----------------------------------------------------------')
+    print(output)
+    print('-----------------------------------------------------------')
     # print('---------------Remove Dates-----------------------')
     # print(output)
     )
     output = output['choices'][0]['message']['content']
+    print('-----------------------------------------------------------')
+    print(output)
+    print('-----------------------------------------------------------')
     # Remove starting header string in output
     find_index = output.find(' '.join(pdftext.split()[:3]))
     if find_index != -1:
         output = output[find_index:].strip()
+    print('-----------------------------------------------------------')
+    print(output)
+    print('-----------------------------------------------------------')
     # print('---------------Remove Addresses-----------------------')
     # print(output)
     )
     output = output['choices'][0]['message']['content']
+    print('-----------------------------------------------------------')
+    print(output)
+    print('-----------------------------------------------------------')
     # Remove starting header string in output
     find_index = output.find(' '.join(pdftext.split()[:3]))
     if find_index != -1:
         output = output[find_index:].strip()
+    print('-----------------------------------------------------------')
+    print(output)
+    print('-----------------------------------------------------------')
     # print('---------------Remove Names-----------------------')
     # print(output)
     )
     output = output['choices'][0]['message']['content']
+    print('-----------------------------------------------------------')
+    print(output)
+    print('-----------------------------------------------------------')
     # Remove starting header string in output
     find_index = output.find(' '.join(pdftext.split()[:3]))
     if find_index != -1:
         output = output[find_index:].strip()
+    print('-----------------------------------------------------------')
+    print(output)
+    print('-----------------------------------------------------------')
     # print('---------------Remove Registration Numbers-----------------------')
     # print(output)