Health Information Processing. Evaluation Track Papers: 9th China Conference, CHIP 2023, Hangzhou, China, October 27–29, 2023, Proceedings (Communications in Computer and Information Science, 2080) 9819717167, 9789819717163

This book constitutes the refereed proceedings of the evaluation track of the 9th China Health Information Processing Co

153 21 22MB

English Pages 259 [250] Year 2024

Table of contents :
Preface
Organization
Contents
CHIP-PromptCBLUE Medical Large Model Evaluation
Overview of the PromptCBLUE Shared Task in CHIP2023
1 Introduction
2 Related Work
2.1 Medical Natural Language Processing
2.2 Parameter-Efficient Fine-Tuning
2.3 In-Context Learning
3 Overview of PromptCBLUE
3.1 Overview
3.2 Prompt Collection
3.3 Response Format
3.4 Sample Format
3.5 Dataset Splits
3.6 Evaluation Metrics
4 Participating Teams and Methods
4.1 Participating Teams
4.2 Wining Teams
4.3 Methods of the PEFT Track
4.4 Methods of the ICL Track
5 Conclusion
References
Innovative Design of Large Language Model in the Medical Field Based on chip-PromptCBLUE
1 Introduction
2 Related Work
3 Method
3.1 Prompt Construction
3.2 Data Amplification
3.3 Entity Loss
4 Experiments
4.1 Datasets and Evaluation Metrics
4.2 Experimental Setup
4.3 Results
4.4 Ablation Study
5 Conclusion
References
CMed-Baichuan: Task Explanation-Enhanced Prompt Method on PromptCBLUE Benchmark
1 Introduction
2 Related Work
2.1 Large Language Models
2.2 Tuning on Large Language Models
2.3 Evaluation on LLMs
3 PromptCBLUE Benchmark and Metrics
3.1 Benchmark Description
3.2 Task Transformation
3.3 Overall Score
4 CMed-Baichuan Model
4.1 Base Model
4.2 Data Augmentation
4.3 Parameter-Efficient Fine-Tuning
4.4 Task Explanation-Enhanced Prompt
5 Experiment
5.1 Baselines
5.2 Hyper-Parameters and Environment
5.3 Results
5.4 Parameter Optimization
5.5 Analysis on Data Augmentation
6 Case Study
6.1 CMeEE
6.2 CHIP-MDCFNPC
6.3 CHIP-CDN
7 Conclusion
References
Improving LLM-Based Health Information Extraction with In-Context Learning
1 Introduction
2 Related Work
2.1 Large Language Model and In-Context Learning
2.2 Information Extraction Based on LLM
3 Our Methods
3.1 Basic LLM
3.2 Prompt Format
3.3 Demonstration Retrieval Strategy
4 Experiment
4.1 Setup
4.2 Results
4.3 Probability Calibration
5 Conclusion
References
ECNU-LLM@CHIP-PromptCBLUE: Prompt Optimization and In-Context Learning for Chinese Medical Tasks
1 Introduction
2 Related Work
2.1 Prompt Engineering
2.2 In-Context Learning
2.3 Semantic Retrieval
3 Method
3.1 Chain of Thought
3.2 BGE
3.3 Post-processing
4 Experiments
4.1 Datasets and Evaluation Metrics
4.2 Experimental Setup
4.3 Analysis
4.4 Experiments Result
5 Conclusion
References
Similarity-Based Prompt Construction for Large Language Model in Medical Tasks
1 Introduction
2 Preliminaries
3 In-Context Learning with Similarity-Based Prompt Construction
3.1 Data Preprocessing
3.2 Similarity-Based Demonstration Selection
3.3 Prompt-Based Answer Generation
3.4 Answer Alignment
4 Experiments
4.1 Experimental Setup
4.2 Results and Analysis
5 Conclusion
References
Chinese Medical Text Few-shot Named Entity Recognition
CMF-NERD: Chinese Medical Few-Shot Named Entity Recognition Dataset with State-of-the-Art Evaluation
1 Introduction
2 Related Works
2.1 Few-Shot NER Datasets
2.2 Medical NER Datasets
3 CMF-NERD Dataset
3.1 Data Source
3.2 Resampling and Analysis
4 Experiments
4.1 Task Formulation
4.2 Baselines
4.3 Results and Analysis
5 Conclusion
References
Chinese Biomedical NER Based on Self-attention and Word-Relation Decoding Strategy
1 Introduction
2 Related Work
3 The Method
3.1 Overall Architecture
3.2 Decoding Strategy
4 Experience
4.1 Dataset
4.2 Implementation Details
4.3 Evaluation
4.4 Main Results
5 Conclusion
References
Drug Paper Document Recognition and Entity Relation Extraction
CHIP 2023 Task Overview: Complex Information and Relation Extraction of Drug-Related Materials
1 Introduction
2 Related Works
3 Dataset
3.1 Task Definition
3.2 Data Annotation
3.3 Evaluation Metric
4 Submission Result
4.1 Overall Statistics
4.2 Top Model
5 Conclusion
References
Rule-Enhanced Pharmaceutical Instructions Information Extraction Based on Deep Learning
1 Introduction
2 Method
2.1 Preprocessing Module
2.2 Textualization Module
2.3 Information Extraction Module
3 Experiments
3.1 Dataset
3.2 Experimental Settings
3.3 Results
4 Conclusion
References
CHIP-YIER Medical Large Model Evaluation
Overview of CHIP2023 Shared Task 4: CHIP-YIER Medical Large Language Model Evaluation
1 Introduction
2 Related Work
2.1 Medical LLMs Evaluation Benchmarks
2.2 Related Techniques
3 Task Details
3.1 Task Description
3.2 Dataset
3.3 Evaluation Metric
4 Submission Result
4.1 Overall Statistics
4.2 Top Two Models
5 Conclusion
References
A Medical Diagnostic Assistant Based on LLM
1 Introduction
2 Related Work
2.1 LLMs for Medication
2.2 Question Answering Task in Medication
2.3 Chain-of-Thought
2.4 Parameters-Efficient Optimizations
3 Methodology
3.1 Model Structure
3.2 Task Description
3.3 Data Augmentation
3.4 Prompt Design
3.5 Training of Our Model
3.6 Inference Process
4 Experiments
4.1 Data Analysis
4.2 Parameter Settings
4.3 Evaluation Indicators
4.4 Results
5 Conclusion
References
Medical Knowledge Q&A Evaluation Based on ChatGPT Ensemble Learning
1 Introduction
2 Related Work
2.1 Medical-Domain LLMs
2.2 Medical Question Answering
2.3 Ensemble Learning
3 Methods
3.1 Prompting
3.2 Regular Expression Processing
3.3 Ensemble Voting
4 Experiments
4.1 Dataset
4.2 Evaluation Indicators
4.3 Results
5 Conclusion
References
Medical Literature PICOS Identification
Overview of CHIP 2023 Shared Task 5: Medical Literature PICOS Identification
1 Introduction
2 Related Work
3 Dataset
3.1 Task Definition
3.2 Data Annotation
3.3 Evaluation Metrics
4 Results
4.1 Overview
4.2 Top Three Solutions
5 Conclusion
References
Task-Specific Model Allocation Medical Papers PICOS Information Extraction
1 Introduction
2 Data Description
3 Related Work
4 Method
4.1 Global Pointer Network
4.2 Classification Head
4.3 Fusion Model
5 Experiments
5.1 Data Preprocessing
5.2 Evaluation Metrics
5.3 Parameter Settings
5.4 Training Techniques
5.5 Results
6 Discussion
References
LLM Collaboration PLM Improves Critical Information Extraction Tasks in Medical Articles
1 Introduction
2 Related Work
2.1 Information Extraction Method Based on Traditional Pre-training Models
2.2 Information Extraction Methods Based on Large Models
3 Proposed Framework
3.1 Task Decomposition
3.2 Information Classification Module
3.3 Information Extraction Module
4 Experiment
4.1 Experimental Setting
4.2 Experimental Results
5 Conclusion
References
Enhancing PICOS Information Extraction with UIE and ERNIE-Health
1 Introduction
2 Related Work
2.1 Information Extraction-Related Tasks
2.2 Text Classification-Related Work
3 Proposed Framework
3.1 Main Model
4 Experiment
4.1 Datasets
4.2 Information Extraction
4.3 Text Classification
4.4 Setting
4.5 Experimental Results
5 Conclusion
References
Chinese Diabetes Question Classification
The CHIP 2023 Shared Task 6: Chinese Diabetes Question Classification
1 Introduction
2 Related Work
3 Dataset
3.1 Dataset Collection
3.2 Dataset Statistics
3.3 Evaluation
3.4 Baseline Models
4 The Results
4.1 Overall Statistics
4.2 Top-3 Performance
5 Conclusion
References
Chinese Diabetes Question Classification Using Large Language Models and Transfer Learning
1 Introduction
2 Related Work
3 Methodology
3.1 Prompt Construction
3.2 Supervised Fine-Tuning
3.3 Transfer Learning
4 Experiments
4.1 Evaluation Metrics
4.2 Experimental Setup
4.3 Experimental Results
5 Conclusion
References
A Model Ensemble Approach with LLM for Chinese Text Classification
1 Introduction
2 Related Work
2.1 Text Classification
2.2 Adversarial Training
2.3 Fine-Tuning of Large Language Models
2.4 Data Augmentation
2.5 Prompt Engineering
3 Proposed Methodology
3.1 Model Structure
3.2 Problem Description
3.3 Data Construction
3.4 Data Augmentation
3.5 Model Integration
3.6 External Tool Utilization
3.7 Voting Mechanism
4 Experiments
4.1 Data Analysis
4.2 Parameter Settings
4.3 Evaluation Indicators
4.4 Results
4.5 Ablation Experiments
5 Conclusion
References
Text Classification Based on Multilingual Back-Translation and Model Ensemble
1 Introduction
2 Related Work
2.1 Pre-trained Models
2.2 Text Classification
3 Methods
3.1 Multilingual Back-Translation
3.2 Model Ensemble
4 Experiment
4.1 Dataset
4.2 Evaluation Index
4.3 Setting
4.4 Result and Analysis
5 Conclusion
References
Author Index

Recommend Papers

Health Information Processing: 9th China Health Information Processing Conference, CHIP 2023, Hangzhou, China, October 27–29, 2023, Proceedings (Communications in Computer and Information Science) 9819998638, 9789819998630

This book constitutes the refereed proceedings of the 9th China Health Information Processing Conference, CHIP 2023, hel

121 12 32MB Read more

Health Information Processing. Evaluation Track Papers: 8th China Conference, CHIP 2022, Hangzhou, China, October 21–23, 2022, Revised Selected Papers ... in Computer and Information Science) 9819948258, 9789819948253

This book constitutes the papers presented at the Evaluation Track of the 8th China Conference on Health Information Pro

109 13 15MB Read more

Health Information Processing: 8th China Conference, CHIP 2022, Hangzhou, China, October 21–23, 2022, Revised Selected Papers 9811998647, 9789811998645

This book constitutes refereed proceedings of the 8th China Conference on China Health Information Processing Conference

212 9 15MB Read more

Emerging Information Security and Applications: 4th International Conference, EISA 2023, Hangzhou, China, December 6–7, 2023, Proceedings (Communications in Computer and Information Science) 9819996139, 9789819996131

This volume constitutes the proceedings presented at the 4th International Conference on Emerging Information Security a

116 59 18MB Read more

Wireless Sensor Networks: 17th China Conference, CWSN 2023, Dalian, China, October 13–15, 2023, Proceedings (Communications in Computer and Information Science) 981971009X, 9789819710096

This book constitutes the refereed proceedings of the 17th China Conference on Wireless Sensor Networks, CWSN 2023, whic

115 99 22MB Read more