Dhawal Gupta

Citado por

	Total	Desde 2019
Citas	133	133
Índice h	7	7
Índice i10	5	5

202020212022202320246 20 43 47 17

Acceso público

Ver todo

2 artículos

1 artículo

disponibles

no disponibles

Basado en requisitos de financiación

Coautores

Dr. Pushpak BhattacharyyaProfessor of Computer Science and Engineering, IIT BombayDirección de correo verificada de cse.iitb.ac.in
Tulika SahaLecturer/Assistant Professor, Dept. of Computer Science, University of Liverpool, United KingdomDirección de correo verificada de liverpool.ac.uk
Dr. Sriparna SahaAssociate Professor, Department of Computer Science and Engineering, Indian Institute of TechnologyDirección de correo verificada de iitp.ac.in
Martha WhiteUniversity of AlbertaDirección de correo verificada de ualberta.ca
Andrew PattersonUniversity of AlbertaDirección de correo verificada de ualberta.ca
Sina GhiassianResearch Scientist - SpotifyDirección de correo verificada de ualberta.ca
Adam WhiteUniversity of Alberta, Amii (Alberta Machine Intelligence Institute)Dirección de correo verificada de ualberta.ca
Philip ThomasUniversity of Massachusetts AmherstDirección de correo verificada de cs.umass.edu
Yinlam ChowResearch Scientist, Google ResearchDirección de correo verificada de google.com
James KostasPhD Student, University of Massachusetts AmherstDirección de correo verificada de umass.edu
Scott M. JordanPostdoctoral Fellow, University of AlbertaDirección de correo verificada de ualberta.ca
Matthew Kyle SchlegelUniversity of AlbertaDirección de correo verificada de ualberta.ca
Atul ThakurAssociate Professor of Mechanical Engineering, Indian Institute of Technology PatnaDirección de correo verificada de iitp.ac.in

Seguir

Dhawal Gupta

Graduate Student, University of Massachusetts, Amherst

Dirección de correo verificada de umass.edu - Página principal

Reinforcement Learning Machine Learning Robotics Optimal Control


Título Ordenar por citas Ordenar por año Ordenar por título	Citado por Citado por	Año
Gradient Temporal-Difference Learning with Regularized Corrections S Ghiassian, A Patterson, S Garg, D Gupta, A White, M White International Conference on Machine Learning, 3524-3534, 2020	43	2020
Emotion Aided Dialogue Act Classification for Task-Independent Conversations in a Multi-modal Framework T Saha, D Gupta, S Saha, P Bhattacharyya Cognitive Computation, 1-13, 2020	22	2020
Towards integrated dialogue policy learning for multiple domains and intents using Hierarchical Deep Reinforcement Learning T Saha, D Gupta, S Saha, P Bhattacharyya Expert Systems with Applications 162, 113650, 2020	18	2020
Exploring the impact of low-rank adaptation on the performance, efficiency, and regularization of RLHF S Sun, D Gupta, M Iyyer arXiv preprint arXiv:2309.09055, 2023	10	2023
A Mixture-of-Expert Approach to RL-based Dialogue Management Y Chow, A Tulepbergenov, O Nachum, MK Ryu, M Ghavamzadeh, ... arXiv preprint arXiv:2206.00059, 2022	10	2022
A hierarchical approach for efficient multi-intent dialogue policy learning T Saha, D Gupta, S Saha, P Bhattacharyya Multimedia Tools and Applications, 1-26, 2020	9	2020
Reinforcement Learning Based Dialogue Management Strategy T Saha, D Gupta, S Saha, P Bhattacharyya International Conference on Neural Information Processing, 359-372, 2018	9	2018
Structural Credit Assignment in Neural Networks using Reinforcement Learning D Gupta, G Mihucz, MK Schlegel, JE Kostas, PS Thomas, M White Thirty-Fifth Conference on Neural Information Processing Systems, 2021	5	2021
A unified dialogue management strategy for multi-intent dialogue conversations in multiple languages T Saha, D Gupta, S Saha, P Bhattacharyya Transactions on Asian and Low-Resource Language Information Processing 20 (6 …, 2021	3	2021
Bayesian Optimization Based Terrestrial Gait Tuning for a 12-DOF Alligator-Inspired Robot With Active Body Undulation K Agrawal, K Jain, D Gupta, R Srivastav, A Agnihotri, A Thakur ASME 2018 International Design Engineering Technical Conferences and …, 2018	3	2018
Coagent Networks: Generalized and Scaled JE Kostas, SM Jordan, Y Chandak, G Theocharous, D Gupta, M White, ... arXiv preprint arXiv:2305.09838, 2023	1	2023
From Past to Future: Rethinking Eligibility Traces D Gupta, SM Jordan, S Chaudhari, B Liu, PS Thomas, BC da Silva arXiv preprint arXiv:2312.12972, 2023		2023
Behavior Alignment via Reward Function Optimization D Gupta, Y Chandak, SM Jordan, PS Thomas, BC da Silva arXiv preprint arXiv:2310.19007, 2023		2023
Offline Reinforcement Learning for Mixture-of-Expert Dialogue Management D Gupta, Y Chow, M Ghavamzadeh, C Boutilier arXiv preprint arXiv:2302.10850, 2023		2023
Applicability of Momentum in the Methods of Temporal Learning D Gupta		2020
A Generic Dialogue Manager using Reinforcement Learning in a Multilingual Multi-intent Multi-domain Setting D Gupta		2019
Utility of accelerated temporal difference methods over gradient based optimizers D Gupta
Investigating the Utility of Off-Policy Data in PPO Algorithm Y Yuan, D Gupta

El sistema no puede realizar la operación en estos momentos. Inténtalo de nuevo más tarde.

Artículos 1–18

Citas por año

Citas duplicadas

Citas combinadas

Añadir coautoresCoautores

Seguir

Citado por

Coautores