-
Notifications
You must be signed in to change notification settings - Fork 1
/
questions.qmd
50 lines (25 loc) · 3.04 KB
/
questions.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
---
title: "Follow-up Q & A"
---
## Leveraging R for Real-Time Data Analysis and Reporting in the AI+HI Paradigm
### Kai Gu: 请问下这个tool的适用人群包括哪些部门
Hao:适用人群比较广泛,有数据分析,做table,画图等需求的部门都可以,如DM 用来做data query, Programming和Stat用来计算和画图
### Longfei: 正如Hao所说 我们这一行是很严格的 这个case 准确率如何?
Hao:当前主要是copilot,人机结合,人工验证。 主要用GPT3.5,简单到中等任务可以,复杂的需要人在draft的code上做进一步修改。GPT4 准确率会更高,但是太慢不能real-time,人机结合体验不好,同时token cost也比较高。随着LLM不断推陈出新,可以期待越来越多的任务会变得容易
### Zou, Ivan: 请问以上结果都是在模型中基于prompt input做出来的吗? 是否有用到其他RAG或者fine-tuned?
Hao:现在是基于直接prompt和RAG辅助。之前有用到复杂的COT和GPT4去处理复杂的问题,但是处理时间太长。为了real-time达到copilot的效果,主要是用GPT3.5; 未来会考虑fine-tune,效率可以进一步提高
## DaVinci Journey in the Early Phase Oncology Study
### 请问和teal的融合时,需要把data都按照teal做预处理吗?(teal_data?)
是的,需要的。Teal是基于ADaM,遵守Roche内部的ADS 标准。当我们的ADaM和Roche ADaM 有出入的时候,会有报错。
有时候提示信息也不会很明显,这样导致了的很多时间都花在了debug改数据上。
## Optimize decision-making efficiency and speed by performing exploratory analysis through the MedDRAH platform
### Qike: 请问这个网站是开放还是仅供内部使用的?
ZY: 目前仅仅是内部使用
### wenlu: 请问ongoing 的数据如果遇到data issue,是否会影响展示的数据。
ZY: 要看是什么样的data issue,是否影响了后端的计算。如果程序做了error处理,也会报出来一些错误。通过错误看是改程序还是改数据。对于不影响展示的数据,比如outlier之类的,这个工具也可以用来发现data issue
### wenlu: 请问开发这个交互平台用了多长的时间和投入了多少resource
不算前期调研,MDR 板块用了大概半年时间。我做了大部分的后端和前端,一名IT同事做了一部分前端,两个本组的同事帮忙做了两个后端API 的函数。
### Keyu Chen: 请问这个平台的Web应用是支持多线程的吗?会存在高并发的问题吗
ZY: 支持多线程, 高并发还要后面去解决。现在只是先把功能做好,能用起来。
### Zou, Ivan: 请问在build前端界面时,由于后端是使用的R和python,那么前端不直接用Python Flask或者R shiny构建的理由? 同样对于table和plot的display,有考虑直接使用Python或者R中的库去实现相同效果吗?
ZY: Javascript 做前端会更灵活和方便。互动性也会更好。Plotly 也有Python 版本吧。R 产生的图不支持互动。