Publications

You can also find my articles on my Google Scholar profile.

Hao Yu, Bo Shen, Jiaxin Zhang, Lin Li, Shaoxin Lin, Guangtai Liang, Ying Li, Qianxiang Wang. and Tao Xie: Toward Effectively Generating Code Beyond Standalone Functions via Generative Pre-trained Models. (TOSEM’2024, Accepted)

Hao Yu, Bo Shen, Jiaxin Zhang, Dezhi Ran, Qi Zhang, Yuchi Ma, Guangtai Liang, Ying Li, Qianxiang Wang, and Tao Xie. CoderEval: A Benchmark of Pragmatic Code Generation with Generative Pre-trained Model. (ICSE’2024)

Hao Yu, Xing Hu, Ge Li, Ying Li, Qianxiang Wang, and Tao Xie. Assessing and Improving an Evaluation Dataset for Detecting Semantic Code Clones via Deep Learning. (TOSEM’2022)

Hao Yu, Yiling Lou, Ke Sun, Dezhi Ran, Tao Xie, Dan Hao, Ying Li, Ge Li, and Qianxiang Wang. Automated Assertion Generation via Information Retrieval and Its Integration with Deep Learning. (ICSE’2022)

Hao Yu, Wing Lam, Long Chen, Ge Li, Tao Xie, and Qianxiang Wang. Neural Detection of Semantic Code Clones via Tree-Based Convolution. (ICPC’2019)

Hao Yu, Tianyu Chen, Jiaming Huang, Zongyang Li, Dezhi Ran, Xinyu Wang, Ying Li, Assaf Marron, David Harel, Yuan Xie, Tao Xie. DeCon: Detecting Incorrect Assertions via Postconditions Generated by a Large Language Model. (Arxiv2025)

Fenia Christopoulou, Gerasimos Lampouras, … , Hao Yu, … Xin Jiang, Qianxiang Wang, and Qun Liu. PanGu-Coder: Program Synthesis with Function-Level Language Modeling. (Technique Report, Arxiv2022)

Dong Chen, … , Hao Yu, …, and Qianxiang Wang. CodeR: Issue Resolving with Multi-Agent and Task Graphs. (Arxiv2024)

Yibo He, Jiaming Huang, Hao Yu, Tao Xie. An Empirical Study on Focal Methods in Deep-Learning-Based Approaches for Assertion Generation. (FSE2024)

Tianyu Chen, Shuai Lu, Shan Lu, Yeyun Gong, Chenyuan Yang, Xuheng Li, Md Rakib Hossain Misu, Hao Yu, Nan Duan, Peng CHENG, Fan Yang, Shuvendu K Lahiri, Tao Xie, Lidong Zhou, Automated Proof Generation for Rust Code via Self-Evolution, `ICLR’25)

Xiaotong Liu, Tong Jia, Ying Li, Hao Yu, Yang Yue, Chuanjia Hou. Automatically generating descriptive texts in logging statements: How far are we?. (APLAS2022)

Linyi Li, Shijie Geng, Zhenwen Li, Yibo He, Hao Yu, Ziyue Hua, Guanghan Ning, Siwei Wang, Tao Xie, Hongxia Yang. Infibench: Evaluating the question-answering capabilities of code large language models. (NeurIPS2024, Datasets and Benchmarks Track)

Xiaosong Huang, Yifan Wu, Hongyi Liu, Ying Li, Hao Yu, Dadi Guo, Zhonghai Wu. UDA-DP: Unsupervised domain adaptation for software defect prediction. (SANER2023)