·“大模子睁开到明天,钻研置像GPT4.0已经能耐颇为强盛,院沈但着实也还存在良多下场 ,向洋下场咱们要找到其中的若何下场,去思考还可能做些甚么 。处置一个公认的未处远远不处置的下场是多模态 ,除了文本之外,钻研置首先便是院沈图像以及合计机视觉。”
IDEA钻研院(粤港澳大湾区数字经济钻研院)创院理事长、向洋下场美国国家工程院外籍院士沈向洋在深圳举行的若何2023 IDEA大会上。
“在大模子发达睁开的处置明天,咱们要问自己多少个下场,未处尚有甚么机缘?咱们还能做些甚么 ?”
11月22日,钻研置IDEA钻研院(粤港澳大湾区数字经济钻研院)创院理事长、院沈美国国家工程院外籍院士沈向洋在深圳举行的向洋下场2023 IDEA大会上展现,“大模子睁开到明天,像GPT4.0(OpenAI研发的狂语言模子)已经能耐颇为强盛,但着实也还存在良多下场,咱们要找到其中的下场 ,去思考还可能做些甚么 。一个公认的远远不处置的下场是多模态,除了文本之外,首先便是图像以及合计机视觉。”
推出视觉揭示模子T-Rex
那末视觉大模子尚有不机缘 ?沈向洋以为 ,合计机视觉有良多自己的特色 ,第一是场景颇为长尾,可能清晰为“有一百个场景 ,就患上有一百个模子” 。第二是下场碎片化,而非妄想化 。这一方面象征着下场间差距大,另一方面则是互联网的数据并缺少够将合计机视觉需要检测的场景都拆穿困绕。这就象征着,像GPT之于语言清晰规模同样