OOIR: Observatory of International Research

Papers

(The H4-Index of IEEE Transactions on Parallel and Distributed Systems is 51. The table below lists those papers that are above that threshold based on CrossRef citation counts [max. 250 papers]. The publications cover those that have been published in the past four years, i.e., from 2022-06-01 to 2026-06-01.)

Article	Citations
Critique of “MemXCT: Memory-Centric X-Ray CT Reconstruction With Massive Parallelization” by SCC Team From Tsinghua University	206
Enabling Large Scale Simulations for Particle Accelerators	196
Design and Implementation of 2D Convolution on x86/x64 Processors	146
Online Container Caching for IoT Data Processing in Serverless Edge Computing	142
Distributed Task Processing Platform for Infrastructure-Less IoT Networks: A Multi-Dimensional Optimization Approach	136
EdgeTB: A Hybrid Testbed for Distributed Machine Learning at the Edge With High Fidelity	130
H5Intent: Autotuning HDF5 With User Intent	125
AWB+-Tree: A Novel Width-Based Index Structure Supporting Hybrid Matching for Large-Scale Content-Based Pub/Sub Systems	115
fPIM: A Holistic Design to Optimize PIM Data Flow for High Execution Efficiency	115
Fully Decentralized Data Distribution for Large-Scale HPC Systems	113
Mapping Large-Scale Spiking Neural Network on Arbitrary Meshed Neuromorphic Hardware	111
QoS-Aware Scheduling of Remote Rendering for Interactive Multimedia Applications in Edge Computing	107
STR: Hybrid Tensor Re-Generation to Break Memory Wall for DNN Training	106
Replicated Versioned Data Structures for Wide-Area Distributed Systems	102
mtGEMM: An Efficient GEMM Library for Modern Multi-Core DSPs	95
Jdebug: A Fast, Non-Intrusive and Scalable Fault Locating Tool for Ten-Million-Scale Parallel Applications	94
Large-Scale Neural Network Quantum States Calculation for Quantum Chemistry on a New Sunway Supercomputer	91
An Efficient Bottleneck Planes Exclusion Method for Reconfiguring 3D VLSI Arrays	88
A Point Cloud Video Recognition Acceleration Framework Based on Tempo-Spatial Information	88
IRHunter: Universal Detection of Instruction Reordering Vulnerabilities for Enhanced Concurrency in Distributed and Parallel Systems	87
HRCM: A Hierarchical Regularizing Mechanism for Sparse and Imbalanced Communication in Whole Human Brain Simulations	85
GeoScale: Microservice Autoscaling With Cost Budget in Geo-Distributed Edge Clouds	84
UniOrch: A Unified Mixed Framework for High-Efficiency LLM Training on Heterogeneous AI Chips	82
Bal-DGCN: A Hardware Acceleration Framework for Balanced Computational Efficiency in DGCNs	80
Optimizing Data Locality by Integrating Intermediate Data Partitioning and Reduce Task Scheduling in Spark Framework	77

Federated Learning With Nesterov Accelerated Gradient	75
A Memory-Constraint-Aware List Scheduling Algorithm for Memory-Constraint Heterogeneous Muti-Processor System	71
On the Message Complexity of Fault-Tolerant Computation: Leader Election and Agreement	71
ComStar: Compression-Aware Stream Query for Heterogeneous Hybrid Architecture	69
RHINO: An Efficient Serverless Container System for Small-Scale HPC Applications	69
DyLaClass: Dynamic Labeling Based Classification for Optimal Sparse Matrix Format Selection in Accelerating SpMV	67
HarmonyCache: Scalable In-Network Cache With Read-Write Separation	67
On the Performance of SMASH: A Non-Preemptive Window-Based Scheduler for Multiserver Jobs	66
PHIDE: A Parallel Hybrid Direct–Iterative Eigensolver for Hermitian Eigenvalue Problems	65
Simple, Fast and Widely Applicable Concurrent Memory Reclamation via Neutralization	64
Accelerating Data Delivery of Latency-Sensitive Applications in Container Overlay Network	64
Securing Fine-Grained Data Sharing and Erasure in Outsourced Storage Systems	63
Asynchronous Algorithms for Decentralized Resource Allocation Over Directed Networks	62
Graph-Centric Performance Analysis for Large-Scale Parallel Applications	62
BARM: A Batch-Aware Resource Manager for Boosting Multiple Neural Networks Inference on GPUs With Memory Oversubscription	61
Joint Model Pruning and Topology Construction for Accelerating Decentralized Machine Learning	60
A Novel Parallel Algorithm for Sparse Tensor Matrix Chain Multiplication via TCU-Acceleration	60
Tag-Sharer-Fusion Directory: A Scalable Coherence Directory With Flexible Entry Formats	60
Agile Cache Replacement in Edge Computing via Offline-Online Deep Reinforcement Learning	58
CiMBA: Accelerating Genome Sequencing Through On-Device Basecalling via Compute-in-Memory	58
Efficient and Automated Deployment Architecture for OpenStack in TianHe SuperComputing Environment	57
Scalable Hybrid Learning Techniques for Scientific Data Compression	57
Building Accurate and Interpretable Online Classifiers on Edge Devices	55
Cannikin: No Lagger of SLO in Concurrent Multiple LoRA LLM Serving	55
Coordinating Fast Concurrency Adapting With Autoscaling for SLO-Oriented Web Applications	54
GreenFlow: A Carbon-Efficient Scheduler for Deep Learning Workloads	53
Improving the Scalability of GPU Synchronization Primitives	51
High-Level Data Abstraction and Elastic Data Caching for Data-Intensive AI Applications on Cloud-Native Platforms	51