diff --git a/q25_14_ins_int8.py b/q25_14_ins_int8.py
new file mode 100644
index 0000000000000000000000000000000000000000..36fa3098625c767c2cfa873122f1789852e1f85d
--- /dev/null
+++ b/q25_14_ins_int8.py
@@ -0,0 +1,203 @@
+import os
+import re 
+import torch 
+import json 
+# import time
+# import pynvml
+from tqdm import tqdm
+import torch.distributed as dist
+from vllm import LLM, SamplingParams
+os.environ["NCCL_P2P_DISABLE"] = "1"
+
+torch.cuda.empty_cache()
+os.environ["TRANSFORMERS_OFFLINE"] = "1"
+os.environ["HF_DATASETS_OFFLINE"] = "1"
+os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "expandable_segments:True"
+texts_path = "/home/limeng/NLP/LLM/data/jcza/record_text2.txt"
+model_path = "/home/limeng/NLP/LLM/model/Qwen2.5-14B-Instruct-GPTQ-Int8"
+output_path = "/home/limeng/NLP/LLM/code/0220/result"
+
+llm = LLM(model=model_path, dtype="half",gpu_memory_utilization=0.9)
+sampling_params = SamplingParams(temperature=0.3, top_p=0.3, max_tokens = 1500)
+
+
+with open(texts_path, "r", encoding="utf-8") as file:
+        for i,line in enumerate(file):
+            medical_record = line.strip()  # å¤„ç†æ¯ä¸€è¡Œï¼ŒåŽ»é™¤é¦–å°¾ç©ºç™½å—ç¬¦
+            prompt = f"""
+ä½ æ˜¯ä¸€ä¸ªä¸“ä¸šçš„åŒ»ç–—ä¿¡æ¯æŠ½å–åŠ©æ‰‹ã€‚è¯·ä»Žä»¥ä¸‹ç—…åŽ†æ•°æ®ä¸ä¸¥æ ¼æŒ‰ç…§#### ç¤ºä¾‹ JSON æå–å—æ®µä¿¡æ¯ï¼Œå¹¶ç¡®ä¿ï¼š
+1. **å—æ®µå¿…é¡»å®Œæ•´**ï¼Œä¸Žç¤ºä¾‹ JSON ç»“æž„å®Œå…¨ä¸€è‡´ï¼Œä¸å¯ç¼ºå¤±/æ–°å¢ž/æ”¹åŠ¨ä»»ä½•å—æ®µ
+2. **é‡ç‚¹å—æ®µç²¾ç¡®**ï¼š
+   - æ‰‹æœ¯å²éœ€æŠ½ææ‰€æœ‰æ‰‹æœ¯åç§°+æ—¶é—´ï¼ˆæ ¼å¼ï¼š"æ‰‹æœ¯åç§°": "æ—¶é—´"ï¼‰
+   - åŒ–ç–—æ–¹æ¡ˆéœ€æŒ‰"æ–¹æ¡ˆå": {{æ—¶é—´+å…·ä½“ç”¨è¯åˆ—è¡¨}} æ ¼å¼æå–
+   - æ”¾ç–—æ–¹æ¡ˆéœ€æŒ‰"æ–¹æ¡ˆæè¿°": {{æ—¶é—´+æ¬¡æ•°+å‰‚é‡}} æ ¼å¼æå–
+3. **ä¸¥æ ¼ç©ºå€¼å¤„ç†**ï¼š
+   - å—ç¬¦ä¸²å—æ®µå¡«"æ— "
+   - åˆ—è¡¨/å—å…¸å—æ®µå¡«ç©ºåˆ—è¡¨[]/ç©ºå—å…¸{{}}
+   - åµŒå¥—ç»“æž„éœ€ä¿æŒå®Œæ•´ï¼ˆå¦‚è‚¿ç˜¤æ‚£ç—…å²å¿…é¡»å«"è‚¿ç˜¤ç±»åž‹"/"è‚¿ç˜¤ç»“å±€"å—æ®µï¼‰
+4. **ä¸¥æ ¼JSONæ ¼å¼**ï¼š
+   - ä¿æŒä¸Žç¤ºä¾‹å®Œå…¨ç›¸åŒçš„ç¼©è¿›/æ ‡ç‚¹æ ¼å¼
+   - ç¡®ä¿æ‰€æœ‰æ‹¬å·é—åˆï¼Œé€—å·æ£ç¡®
+   - ç”Ÿæˆç¬¬ä¸€ä¸ªå®Œæ•´JSONåŽç«‹å³åœæ¢ï¼Œç¦æ¢è§£é‡Šæ€§æ–‡å—   
+
+#### ç—…åŽ†æ•°æ®
+{medical_record}
+
+#### ç¤ºä¾‹ JSON
+{{
+    "æ¶ˆç˜¦": "æœ‰",
+    "å‘•å": "æœ‰",
+    "æ¶å¿ƒ": "æœ‰",
+    "è…¹éƒ¨è‚¿å—": "æœ‰",
+    "è…¹èƒ€": "æœ‰",
+    "è…¹ç—›": "æœ‰",
+    "é‡Œæ€¥åŽé‡": "æœ‰",
+    "è…¹æ³»": "æœ‰",
+    "å¤§ä¾¿å½¢çŠ¶æ”¹å˜": "æœ‰",
+    "æŽ’ä¾¿å›°éš¾": "æœ‰",
+    "é»‘ä¾¿": "æœ‰",
+    "ä¾¿è¡€": "æœ‰",
+    "å¤§ä¾¿ä¹ æƒ¯å’Œæ€§çŠ¶æ”¹å˜": "æœ‰",
+    "è‚ æ¢—é˜»": "æœ‰",
+    "è‚ ç©¿å”": "æœ‰",
+    "æ‰‹æœ¯å²": {{
+        "ç›´è‚ ç™Œç»è…¹å‰åˆ‡é™¤+æœ«ç«¯å›žè‚ é€ å£æœ¯": "2017-01-11æ—¥",
+        "å† è„‰æ”¯æž¶ç½®å…¥æœ¯":" 2019å¹´",
+    }},
+    "è‚è½¬ç§»": "æœ‰",
+    "è‚ºè½¬ç§»": "æœ‰",
+    "è…¹è†œè½¬ç§»": "æœ‰",
+    "éª¨è½¬ç§»": "æœ‰",
+    "è¿œå¤„è½¬ç§»": "æœ‰",
+    "é”éª¨ä¸Šè½¬ç§»": "æœ‰",
+    "è…¹è‚¡æ²Ÿè½¬ç§»": "æœ‰",
+    "è…¹è†œåŽæ·‹å·´ç»“è½¬ç§»": "æœ‰",
+    "å…¶ä»–è¿œå¤„æ·‹å·´è½¬ç§»": "æ— ",
+    "åŒ–ç–—æ–¹æ¡ˆ": {{
+        "2011-1-12è¡ŒXELOXæ–¹æ¡ˆ": 
+        {{"æ—¶é—´": "2011-1-12"
+        "å…·ä½“ç”¨è¯": [
+        "å¡åŸ¹ä»–å®¾1.5g 2/æ—¥d1-14",
+        "å¥¥æ²™åˆ©é“‚200mg d1"
+                    ]
+        }},
+        "2022-7-17ã€8-9è¡ŒFOLFOX+è¥¿å¦¥æ˜”å•æŠ—æ–¹æ¡ˆ":
+        {{ "æ—¶é—´": "2022-7-17ã€8-9"
+        "å…·ä½“ç”¨è¯": [
+        "å¥¥æ²™åˆ©é“‚140mg é™æ»´D1",
+        "äºšå¶é…¸é’™0.6g é™æ»´D1",
+        "5-FU 0.4g é™æ»´D1",
+        "5-FU 4.0g åŒ–ç–—æ³µå…¥44h",
+        "è¥¿å¦¥æ˜”å•æŠ—800mg é™æ»´D1"
+        ]}}
+    }},
+    "æ”¾ç–—æ–¹æ¡ˆ": 
+    {{
+        "ç›†è…”å¤å‘ç¶": {{
+            "æ—¶é—´": "2023-04-20è‡³2023-05-30",
+            "æ¬¡æ•°": "25",
+            "å•æ¬¡å‰‚é‡":"2Gy",
+            "æ€»å‰‚é‡":"50Gy"
+        }},
+        "ç…§å°„æ–¹æ³•ä¸ºé€‚å½¢è°ƒå¼ºæ”¾ç–—IMRTï¼Œåˆ†å‰²æ–¹æ³•ä¸ºå¸¸è§„åˆ†å‰²ï¼Œç–—æ•ˆè¯„ä¼°ä¸ºPR": {{
+            "æ—¶é—´": "2021å¹´11æœˆ15æ—¥å¼€å§‹ï¼Œ2021å¹´12æœˆ24æ—¥ç»“æŸ",
+            "æ¬¡æ•°": "25",
+            "å•æ¬¡å‰‚é‡":"2Gy",
+            "æ€»å‰‚é‡":""
+        }},
+    }},
+    "ä»éœ€æ²»ç–—çš„å…¶ä»–ç–¾ç—…æƒ…å†µ": ["é«˜è¡€åŽ‹", "ç³–å°¿ç—…"],
+    "å…¥é™¢å‰ä»åœ¨æœç”¨çš„æ²»ç–—è¯ç‰©": ["ç¡è‹¯åœ°å¹³ç¼“é‡Šç‰‡", "è¾¾æ ¼åˆ—å‡€", "æ ¼åˆ—é½ç‰¹"],
+    "é«˜è¡€åŽ‹å²": "æœ‰",
+    "ä¼¤å¯’å²": "æœ‰",
+    "ç»“æ ¸å²": "æœ‰",
+    "ç—…æ¯’æ€§è‚ç‚Žå²": "æœ‰",
+    "ç³–å°¿ç—…å²": "æœ‰",
+    "å† å¿ƒç—…å²": "æœ‰",
+    "å† è„‰æ”¯æž¶æ”¾ç½®": "æœ‰",
+    "è„‘å’ä¸å²": "æœ‰",
+    "å…¶ä»–éžè‚¿ç˜¤ç–¾ç—…": [
+        "æ…¢æ€§ä¹™åž‹ç—…æ¯’æ€§è‚ç‚Ž",
+    ],
+    "è‚¿ç˜¤æ‚£ç—…å²": {{
+        "è‚¿ç˜¤ç±»åž‹": "å·¦è‚ºè…ºç™Œ",
+        "è‚¿ç˜¤ç»“å±€": "æ²»æ„ˆ"
+    }}
+    "å¸çƒŸå²": {{
+        "å¸çƒŸå¹´æ•°": "25å¹´",
+        "æ—¥å¸çƒŸé‡": "10æ”¯/å¤©",
+        "æ˜¯å¦æˆ’çƒŸ": "å·²æˆ’çƒŸ15å¹´"
+    }},
+    "é¥®é…’å²": "æœ‰"
+    "å©šè‚²å²": {{
+        "æ˜¯å¦å·²å©š": "å·²å©š",
+        "æ˜¯å¦å·²è‚²": "å·²è‚²",
+        "å·²è‚²æ•°é‡": "1å¥³"
+    }},
+    "ç»“ç›´è‚ ç™Œå®¶æ—å²": {{
+        "é—ä¼ æ€§ç»“ç›´è‚ ç™Œç±»åž‹": "æ— ",
+        "äº²å±žç±»åž‹": "å¼Ÿå¼Ÿ",
+        "å…¶ä»–é—ä¼ æ€§è‚¿ç˜¤": "ç»“è‚ ç™Œ"
+    }},
+    "ä½“æ¸©": "36.0â„ƒ",
+    "å‘¼å¸": "18æ¬¡/åˆ†",
+    "å¿ƒçŽ‡": "80æ¬¡/åˆ†",
+    "è¡€åŽ‹": "120/80mmHg",
+    "BMI": "19.6"
+    "ç›´è‚ æŒ‡è¯Š": {{
+        "ç›´è‚ æŒ‡è¯Šå§¿åŠ¿": "è†èƒ¸ä½",
+        "ç›´è‚ æŒ‡è¯Šæ˜¯å¦è§¦åŠè‚¿å—": "æœ‰",
+        "ç›´è‚ æŒ‡è¯Šè‚¿å—ä¸‹ç¼˜åˆ°è‚›ç¼˜è·ç¦»": "5cm",
+        "ç›´è‚ æŒ‡è¯Šè‚¿å—ä¸‹ç¼˜åˆ°é½¿çŠ¶çº¿è·ç¦»": "æ— ",
+        "ç›´è‚ æŒ‡è¯Šè‚¿å—æ´»åŠ¨åº¦": "å°šå¯",
+        "ç›´è‚ æŒ‡è¯ŠæŒ‡å¥—æŽ¨å‡ºæ˜¯å¦æŸ“è¡€": "æœ‰"
+    }},
+    "è´«è¡€è²Œ": "æœ‰",
+    "å·©è†œé»„æŸ“": "æœ‰",
+    "é”éª¨ä¸Šæ·‹å·´ç»“è‚¿å¤§": "æœ‰",
+    "è…¹å£é™è„‰æ›²å¼ ": "æœ‰",
+    "è‚ å½¢": "æœ‰",
+    "è…¹éƒ¨åŽ‹ç—›": "æœ‰",
+}}    
+"""
+            try:
+                # è°ƒç”¨æ¨¡åž‹ç”Ÿæˆç»“æžœ
+                outputs = llm.generate(prompt, sampling_params)
+                model_output = outputs[0].outputs[0].text
+                print(model_output)
+                # å°è¯•æå– JSON éƒ¨åˆ†
+                json_str = re.search(r'```json\n(.*?)\n```', model_output, re.DOTALL)
+                if json_str:
+                    json_str = json_str.group(1)
+                    result_json = json.loads(json_str)
+                else:
+                    # å¦‚æžœæœªæ‰¾åˆ° JSON éƒ¨åˆ†ï¼Œç›´æŽ¥ä¿å˜åŽŸå§‹æ–‡æœ¬
+                    json_str = re.search(r'#### JSON æå–ç»“æžœ\n(.*?)\n#### JSON æå–ç»“æžœ', model_output, re.DOTALL)
+                    if json_str:
+                        result_json = json.loads(json_str.group(1))
+                    else:
+                        # å¦‚æžœæœªæ‰¾åˆ° #### JSON æå–ç»“æžœ æ ¼å¼ï¼Œå°è¯•æå– #### JSON è¾“å‡º æ ¼å¼
+                        json_str = re.search(r'#### JSON è¾“å‡º\n(.*?)\n#### JSON è¾“å‡º', model_output, re.DOTALL)
+                        if json_str:
+                            result_json = json.loads(json_str.group(1))
+                        else:
+                            json_str = re.search(r'#### JSON æå–ç»“æžœ\n(.*?) æ ¹æ®æ', model_output, re.DOTALL)
+                            if json_str:
+                                result_json = json.loads(json_str.group(1))
+                            else:
+                                result_json = {"error": "Invalid model output format", "original_text": medical_record, "model_output": model_output}
+
+                # ä¿å˜ç»“æžœåˆ° JSON æ–‡ä»¶
+                file_name = f"long_txt{i}.json"
+                file_path = os.path.join(output_path, file_name)
+                with open(file_path, 'w', encoding='utf-8') as f:
+                    json.dump({"text_record": medical_record, "extracted_info": result_json}, f, ensure_ascii=False, indent=4)
+
+            except Exception as e:
+                # æ•èŽ·å¼‚å¸¸å¹¶è®°å½•é”™è¯¯
+                print(f"Error processing record {i}: {e}")
+                # ä¿å˜åŽŸå§‹æ–‡æœ¬
+                file_name = f"long_txt{i}_error.json"
+                file_path = os.path.join(output_path, file_name)
+                with open(file_path, 'w', encoding='utf-8') as f:
+                    json.dump({"text_record": medical_record, "error": str(e)}, f, ensure_ascii=False, indent=4)
\ No newline at end of file