CodeScope: An Execution-based Multilingual Multitask Multidimensional Benchmark for Evaluating LLMs on Code Understanding and Generation

Yan, Weixiang; Liu, Haitian; wang, yunkun; Li, Yunzhe; Chen, Qian; Wang, Wen; Lin, Tingyu; Zhao, Weishan; Zhu, Li; Sundaram, Hari; Deng, Shuiguang

doi:10.18653/v1/2024.acl-long.301

Record link:

http://hdl.handle.net/20.500.12708/204476

Title:

CodeScope: An Execution-based Multilingual Multitask Multidimensional Benchmark for Evaluating LLMs on Code Understanding and Generation

Citation:

Yan, W., Liu, H., wang, yunkun, Li, Y., Chen, Q., Wang, W., Lin, T., Zhao, W., Zhu, L., Sundaram, H., & Deng, S. (2024). CodeScope: An Execution-based Multilingual Multitask Multidimensional Benchmark for Evaluating LLMs on Code Understanding and Generation. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (pp. 5511–5558). https://doi.org/10.18653/v1/2024.acl-long.301

Publisher DOI:

10.18653/v1/2024.acl-long.301

Publication Type:

Inproceedings - Full-Paper Contribution

Language:

English

Authors:

Yan, Weixiang
Liu, Haitian
wang, yunkun
Li, Yunzhe
Chen, Qian
Wang, Wen
Lin, Tingyu
Zhao, Weishan
Zhu, Li
Sundaram, Hari
Deng, Shuiguang

Organisational Unit:

E193-01 - Forschungsbereich Computer Vision

Published in:

Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)

Date (published):

2024

Event name:

The 62nd Annual Meeting of the Association for Computational Linguistics

Event date:

11-Aug-2024 - 16-Aug-2024

Event place:

Bangkok, Thailand

Number of Pages:

Peer reviewed:

Yes

Keywords:

Large Language Models; Code Understanding; Code Generation

Research Areas:

Visual Computing and Human-Centered Technology: 100%

Science Branch:

1020 - Informatik: 90%
1010 - Mathematik: 10%

Appears in Collections:

Conference Paper

Show full item record

Page view(s)

checked on Nov 19, 2024

Download(s)

checked on Nov 19, 2024

Google Scholar^TM

Check

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM