Neural Information Processing: 30th International Conference, ICONIP 2023, Changsha, China, November 20–23, 2023, Proceedings, Part VII (Communications in Computer and Information Science) 9819981255, 9789819981250

The nine-volume set constitutes the refereed proceedings of the 30th International Conference on Neural Information Proc

151 67 62MB

English Pages 608 [603] Year 2023

Table of contents :
Preface
Organization
Contents – Part VII
Theory and Algorithms
A 3D UWB Hybrid Localization Method Based on BSR and L-AOA
1 Introduction
2 Theory of Basic Algorithm
2.1 Basic Chan Algorithm
2.2 Taylor Algorithm
2.3 Problem to Be Solved
3 Base Station Reliability and Theory of L-AOA
3.1 Base Station Reliability
3.2 Theory of L-AOA
4 Experiment and Results
4.1 Experiments on BSR
4.2 Combine Chan with L-AOA and BSR
4.3 Combine L-AOA and BSR with Taylor and Chan
5 Conclusion
References
Unsupervised Feature Selection Using Both Similar and Dissimilar Structures
1 Introduction
2 Related Work
3 Methodology
4 Optimization
4.1 Updating W
4.2 Updating F
4.3 Updating S
4.4 Updating E
4.5 Updating T
5 Experiments
5.1 Experimental Setup
5.2 Experimental Results and Analysis
5.3 Parameter Sensitivity
6 Conclusion
References
STA-Net: Reconstruct Missing Temperature Data of Meteorological Stations Using a Spatiotemporal Attention Neural Network
1 Introduction
2 Related Works
2.1 Missing Data Reconstruction
2.2 Attention
3 Methods and Network Architecture
3.1 A Data Processing Method of Meteorological Stations
3.2 Attention Mechanism and Network Architecture
3.3 Loss Function
4 Experiments
4.1 Experimental Details and Evaluation Indicators
4.2 Datasets and Mask
4.3 Experimental Results
4.4 Ablation Experiments
5 Conclusion and Future Work
References
Embedding Entity and Relation for Knowledge Graph by Probability Directed Graph
1 Introduction
2 Related Work
3 Embedding Entity and Relation for Knowledge Graph by Probability Directed Graph
3.1 Problem Definition
3.2 PGME Model
3.3 Model Learning
4 Experiments and Analysis of Results
4.1 Datasets
4.2 Evaluation Metrics
4.3 Experiment Setting
4.4 Experimental Results and Analysis
5 Conclusion
References
Solving the Inverse Problem of Laser with Complex-Valued Field by Physics-Informed Neural Networks
1 Introduction
2 Methodology
3 Results and Discussions
4 Conclusion
Appendix
References
Efficient Hierarchical Reinforcement Learning via Mutual Information Constrained Subgoal Discovery
1 Introduction
2 Related Works
3 Preliminaries
4 Methodology
4.1 Mutual Information Distance Space
4.2 Efficient Subgoal Discovery with Distance Constraint
4.3 The Policy Optimization
5 Experiments
5.1 Environment Setup
5.2 Comparative Experiments
5.3 Visualizations
5.4 Ablation Studies
6 Conclusion
References
Accelerate Support Vector Clustering via Spectral Data Compression
1 Introduction
2 Preliminary
2.1 Support Vector Clustering
2.2 Graph Laplacian Matrices
3 Methods
3.1 Algorithmic Framework
3.2 Algorithm Complexity
4 Experiment
4.1 Data Sets
4.2 Algorithms for Comparison
4.3 Evaluation Metric
4.4 Experimental Results
5 Conclusion
6 Contributions
References
A Novel Iterative Fusion Multi-task Learning Framework for Solving Dense Prediction
1 Introduction
2 Related Works
2.1 Multi-task Learning (MTL)
2.2 Cross-Task Interaction Mechanisms
3 Methods
3.1 Overall Structure
3.2 Task Pair Interaction Module (TPIM)
3.3 Cross-Task Interaction Block (CIB)
3.4 Iterative Fusion Block (IFB)
4 Experiments
4.1 Experimental Setups
4.2 Comparison with State-of-the-Arts
4.3 Ablation Studies
5 Conclusions
References
Anti-interference Zeroing Neural Network Model for Time-Varying Tensor Square Root Finding
1 Introduction
2 Preliminaries
2.1 Tensor Theory
2.2 Time-Varying Tensor Square Root
3 Anti-interference Zeroing Neural Network
4 Theoretical Analysis
4.1 No Disturbances
4.2 Vanishing Disturbances
4.3 Non-vanishing Disturbances
5 Numerical Experiments
6 Conclusion
References
CLF-AIAD: A Contrastive Learning Framework for Acoustic Industrial Anomaly Detection
1 Introduction
2 Related Work
3 Proposed Method
3.1 Problem Description
3.2 Proposed Contrastive Learning Framework
4 Experiments
4.1 Datasets
4.2 Implementation
4.3 Results and Analysis
5 Conclusion
References
Prediction and Analysis of Acoustic Displacement Field Using the Method of Neural Network
1 Introduction
2 Related Physical Background
3 Design Neural Networks
4 Error Analysis and Results
5 Conclusion
References
Graph Multi-dimensional Feature Network
1 Introduction
2 Related Work
3 Preliminary Study
4 The Proposed Framewoek
4.1 Multi-dimension Feature Mining Aggregation
4.2 Self-supervised Learning
4.3 Objective Function
5 Experiments
5.1 Experimental Settings
5.2 Node Classification Performance
5.3 Defense Performance
5.4 Over-Smoothing Analysis
5.5 Ablation Study
6 Conclusion
References
CBDN: A Chinese Short-Text Classification Model Based on Chinese BERT and Fused Deep Neural Networks
1 Introduction
2 CBDN
2.1 Text Embedding Layer
2.2 Feature Fusion Module
2.3 Deep Semantic Feature Extraction Module
3 Experimental Settings
3.1 Dataset
3.2 Evaluation Metrics
3.3 Experimental Platform and Parameter Setting
4 Experimental Results and Analysis
5 Ablation Experiment
6 Conclution
References
Lead ASR Models to Generalize Better Using Approximated Bias-Variance Tradeoff
1 Introduction
2 ApproBiVT Recipe
2.1 Bias-Variance Decomposition
2.2 Approximated Bias-Variance Tradeoff
2.3 ApproBiVT-Guided Early Stopping
2.4 k-Best ApproBiVT Checkpoint Averaging
3 Experiments
3.1 Dataset
3.2 Experimental Setup
3.3 Evaluated Models
3.4 Ablation Studies
3.5 AISHELL-1 Results
3.6 AISHELL-2 Results
3.7 Limitations and Scope
4 Conclusion
References
Human-Guided Transfer Learning for Autonomous Robot
1 Introduction
2 Neural Network’s Structure and Learning Process
2.1 Human Guided Pre-training
2.2 Real-Time Reinforcement Learning
3 Robot Platform
4 Experiments
4.1 Pre-training Experiments
4.2 Transfer Experiments
5 Conclusion and Future Works
References
Leveraging Two-Scale Features to Enhance Fine-Grained Object Retrieval
1 Introduction
2 Related Work
3 Our Method
3.1 The Two Branches of Model
3.2 Feature Enhancement Module
3.3 Loss and Temperature Scaling
4 Experiments
4.1 Datasets
4.2 Implementation Details
4.3 Evaluation Protocols
4.4 Comparison with the State-of-the-Art Methods
4.5 Ablation Experiments
4.6 Discussions
5 Conclusion
References
Predefined-Time Synchronization of Complex Networks with Disturbances by Using Sliding Mode Control
1 Introduction
2 Preliminaries
3 Main Results
3.1 Design of a New Sliding Mode Surface
3.2 Design of a New Sliding Mode Controller
4 Numerical Simulations
5 Conclusion and Prospect
References
Reward-Dependent and Locally Modulated Hebbian Rule
1 Introduction
2 Methods
2.1 Dataset and Network Structure
2.2 Reward Modulated Hebbian Rule
2.3 Reward-Dependent and Locally Modulated Hebbian Rule
2.4 Measures of the Network Performance
2.5 Parameters of Learning
3 Results
3.1 RDLM Hebbian Rule Can Train the Network to Perform MNIST Classification Task
3.2 Compare the RDLM Hebbian Rule with Error-Backpropagation Algorithm
4 Conclusion and Discussion
References
Robust Iterative Hard Thresholding Algorithm for Fault Tolerant RBF Network
1 Introduction
2 Background
3 Constrained Optimization Formulation
4 R-IHT
4.1 Algorithm
4.2 Convergence Behavior
5 Simulation
6 Conclusion
References
Cross-Lingual Knowledge Distillation via Flow-Based Voice Conversion for Robust Polyglot Text-to-Speech*-12pt
1 Introduction
2 Related Work
3 Proposed Approach
3.1 Framework
3.2 Model Description
4 Experiments
4.1 Evaluation Setup
4.2 Data Composition
4.3 Experiment Designs and Results
4.4 Discussion
5 Conclusions
References
A Health Evaluation Algorithm for Edge Nodes Based on LSTM
1 Introduction
2 Model Framework and Related Technology
2.1 EH-LSTM Framework
2.2 Feature Discretization Method
2.3 Sequential Learning Algorithm
2.4 Model Parameter Optimization Algorithm
3 Experiments
3.1 Experiment Design
3.2 Training Details
3.3 Results
4 Discussion
References
A Comprehensive Review of Arabic Question Answering Datasets
1 Introduction
2 Methodology
3 Monolingual Datasets for Arabic QA Systems
4 Available Multilingual and Cross-Lingual Datasets for the QA System Include Arabic
5 Discussion
5.1 Guidelines for Arabic QA Dataset
6 Conclusion
References
Solving Localized Wave Solutions of the Nonlinear PDEs Using Physics-Constraint Deep Learning Method
1 Introduction
2 Method
3 Experiments and Results
3.1 The Two-Soliton Solution of Boussinesq Equation
3.2 The Second-Order Rogue Wave Solution of Nonlinear Schrödinger Equation
4 Conclusion
References
Graph Reinforcement Learning for Securing Critical Loads by E-Mobility
1 Introduction
2 Problem Formulation
2.1 Preliminary
2.2 System Model
3 Methodology
3.1 Markov Decision Process
3.2 Algorithm
4 Case Study
4.1 Configuration
4.2 Performance Analysis
5 Conclusion
References
Human-Object Interaction Detection with Channel Aware Attention
1 Introduction
2 Related Work
2.1 Human-Object Interaction Detection
2.2 Attention Mechanism
3 Methodology
3.1 Overview
3.2 Channel-Aware Attention
3.3 The Channel-Aware Module
3.4 The Channel-Aware Encoder
4 Experiment and Result
4.1 Datasets and Evaluation Metrics
4.2 Implementation Details
4.3 Performance Analysis
4.4 Visual Analysis
5 Conclusion
References
AAKD-Net: Attention-Based Adversarial Knowledge Distillation Network for Image Classification
1 Introduction
2 Related Work
3 Methods
3.1 Knowledge Distillation with Adversarial Training
3.2 Knowledge Distillation with Attention
4 Experiments
4.1 Dataset
4.2 Experiments Settings
4.3 Performance Comparison
4.4 Ablation Study
5 Conclusion
References
A High-Performance Tensorial Evolutionary Computation for Solving Spatial Optimization Problems
1 Introduction
2 Background and Preliminaries
2.1 Tensor and Tensor Algebra
2.2 CUDA-Based GPU Computation
3 Tensorial Evolution
3.1 Overview of ETE
3.2 CUDA-Based ETE Implementation
4 Experiment
4.1 Experimental Setup
4.2 Case Study 1: Facility Layout Problem
4.3 Case Study 2: Image Steganography Problem
5 Conclusion
References
Towards Better Evaluations of Class Activation Mapping and Interpretability of CNNs
1 Introduction
2 Related Work
3 Methods
3.1 Average Cropping Confidence Drop (ACCD)
3.2 Average Cropping Ratio (ACR)
3.3 Interpretable Framework Based on Mutual Information Maximization (MIM)
4 Experiment
4.1 Metrics Validity Verification Experiment Details
4.2 Results of Metrics Validity Verification Experiment
4.3 Constructing the Mutual Information Estimator
4.4 Training Strategy
4.5 Results of Mutual Information Maximization
5 Conclusion
References
Contrastive Learning-Based Music Recommendation Model
1 Introduction
2 Related Works
2.1 Music Recommender System
2.2 Contrastive Learning
3 Contrastive Learning Model for Music Recommendation Literature Review
3.1 Supervised Music Recommendation Model
3.2 Unsupervised Contrastive Learning Music Recommendation Model
3.3 Contrastive Loss Function
4 Experiments
4.1 Datasets
4.2 Training Settings
4.3 Baselines
4.4 Comparative Experiments
4.5 Ablation Experiments
5 Conclusion
References
A Memory Optimization Method for Distributed Training
1 Introduction
2 Related Work
3 Main Work
3.1 Prefix Sum Partition Algorithm
3.2 Clock Optimization Strategy
4 Experimental Results and Analysis
4.1 Experimental Setup
4.2 Analysis of Training Time and Equipment Throughput
4.3 Analysis of Training Accuracy and Loss Function
5 Conclusions
References
Unsupervised Monocular Depth Estimation with Semantic Reconstruction Using Dual-Discriminator Generative Adversarial
1 Introduction
2 Related Works
2.1 Supervised Learning Method
2.2 Unsupervised Learning Method
3 Network Architecture
3.1 Architecture Overview
3.2 Traditional Unsupervised Monocular Training
3.3 Monocular Training with Semantic Constrains
4 Experiment
4.1 Implementation Details
4.2 Evaluation on KITTI Dataset
5 Conclusion
References
Generating Spatiotemporal Trajectories with GANs and Conditional GANs
1 Introduction
2 Related Work
3 Our Method
3.1 Overview
3.2 TimeGAN [16]
3.3 Our Implementation
4 Experimental Results and Analysis
4.1 Experiment Setup
4.2 Comparison with Baselines
5 Conclusions
References
Visual Navigation of Target-Driven Memory-Augmented Reinforcement Learning
1 Introduction
2 Related Work
2.1 Methods With Auxiliary Information
2.2 Methods Without Auxiliary Information
3 Method
3.1 Problem Setup
3.2 Model Architecture
3.3 Loss Function
4 Experiments
4.1 Datasets
4.2 Evaluation Metrics
4.3 Models
4.4 Comparative Experiments
4.5 Ablation Experiment
5 Conclusions
References
Recursive Constrained Maximum Versoria Criterion Algorithm for Adaptive Filtering
1 Introduction
2 The Proposed RCMVC Algorithm
2.1 System Model
2.2 Optimal Problem
2.3 Constrained Maximum Versoria Criterion Algorithm
2.4 Recursive Constrained Maximum Versoria Criterion Algorithm
3 Performance Analysis for RCMVC
3.1 Convergence Analysis
3.2 Mean Square Deviation
4 Simulation Results
4.1 Validation of Theoretical Transient MSD
4.2 Linear System Identification
5 Conclusion
References
Graph Pointer Network and Reinforcement Learning for Thinnest Path Problem
1 Introduction
2 Related Work
3 Problem Definitions
3.1 Thinnest Path Problem (TPP)
3.2 RL for TPP
3.3 Graph Pointer Network (GPN)
4 Experiments
5 Conclusions
References
Multi-neuron Information Fusion for Direct Training Spiking Neural Networks
1 Introduction
2 Methods
2.1 Neuron Model
2.2 The Multi-neuron Information Fusion Model
3 Experiment
3.1 Datasets Processing
3.2 Network Structure
3.3 Static Dataset
3.4 Neuromorphic Dataset
3.5 Ablation Study
3.6 Analysis of Firing Rates
4 Conclusion
References
Event-Based Object Recognition Using Feature Fusion and Spiking Neural Networks
1 Introduction
2 Methodology
2.1 Preprocessing
2.2 Feature Extraction
2.3 Learning Layer
2.4 Readout Layer
3 Experimental Setup
3.1 On Digit Recognition Datasets
3.2 On Action Recognition Datasets
3.3 Ablation Study of the Feature Extraction
4 Conclusion
References
Circular FC: Fast Fourier Transform Meets Fully Connected Layer for Convolutional Neural Network
1 Introduction
2 Related Work
3 Method
3.1 DFT and FFT
3.2 FC and Circular FC
3.3 From FFT to Circular FC
4 Experiments
4.1 Evaluation Details
4.2 Results on CIFAR-10
4.3 Comparisons with Dropout Regularization
4.4 Resluts on ImageNet
5 Conclusion
References
Accurate Latency Prediction of Deep Learning Model Inference Under Dynamic Runtime Resource
1 Introduction
2 Related Work
2.1 Hardware-Aware Latency Prediction.
2.2 Standard Latency Prediction
3 Methodology
3.1 Workflow
3.2 Unified Nodes Vectorization
3.3 Double Feature Embedding
3.4 Resource Aware Latency Prediction
4 Experiment
4.1 Dataset Description
4.2 Evaluation Metric
4.3 Baseline
4.4 Comparative Experiments
4.5 Validation of RAL Formula
4.6 Ablation Experiment
5 Conclusion
References
Robust LS-QSVM Implementation via Efficient Matrix Factorization and Eigenvalue Estimation
1 Introduction
2 Background
2.1 Least Square Support Vector Machine
2.2 Ridge Regression
3 LS-QSVM with Ridge Regression
3.1 Loss Function Based on Hamiltonian
3.2 Matrix Factorization
3.3 Ridge Regression Coefficient Selection Based on Eigenvalue Estimation
4 Simulation
5 Discussion and Conclusion
5.1 Analysis on Benchmarks
5.2 Analysis on the Ridge Regression Constraint Coefficient
5.3 Conclusion
References
An Adaptive Auxiliary Training Method of Autoencoders and Its Application in Anomaly Detection
1 Introduction
2 Related Work
3 Proposed Method
3.1 Phenomenon Analysis
3.2 Adaptive Auxiliary Training for Autoencoder
3.3 AAT for Anomaly Detection
4 Experiments and Discussion
4.1 Datasets
4.2 Experimental Details
4.3 Validating the Enhancement of Reconstruction with AAT
4.4 Validating the Enhancement of Anomaly Detection with AAT
5 Conclusion
References
Matrix Contrastive Learning for Short Text Clustering
1 Introduction
2 Related Work
2.1 Contrastive Learning
2.2 Short Text Clustering
3 Methodology
3.1 Pair Construction Backbone
3.2 Instance-Level Contrastive Learning Head with K-Nearest Neighbors
3.3 Cluster-Level Contrastive Learning Head
3.4 Clustering Head
4 Experiment
4.1 Dataset
4.2 Baseline Models
4.3 Main Result
4.4 Ablation Experiment
5 Conclusion
References
Sharpness-Aware Minimization for Out-of-Distribution Generalization
1 Introduction
2 Related Works
2.1 Invariant Risk Learning
2.2 Out-of-Distribution Generalization
2.3 Seeking Flat Minima
3 Method
3.1 Preliminaries
3.2 The IRM Framework and IRMv1
3.3 Sharpness-Aware Minimization
3.4 Sharpness-Aware IRM
4 Relation Between Flatness and OOD Generalization
4.1 Experimental Analysis
4.2 Theoretical Analysis
5 Experiments
5.1 Datasets
5.2 Implementation Details
5.3 Results
5.4 More Analysis
6 Conclusion
References
Rapid APT Detection in Resource-Constrained IoT Devices Using Global Vision Federated Learning (GV-FL)*-16pt
1 Introduction
2 Related Work
2.1 Characteristics of APT Attacks
2.2 Existing APT Detection Methods and Limitations
2.3 Federated Learning for APT Detection
2.4 Challenges for APT Detection in IoT Devices
3 Proposed GV-FL Framework for APT Detection
4 Experimental Results
4.1 Baseline Methods
4.2 Results
5 Analysis and Discussion
5.1 Robustness Analysis of GV-FL
5.2 Resilience Analysis of GV-FL
5.3 Discussion
6 Conclusion
References
Author Index