| import gradio as gr |
| from openai import OpenAI |
| import os |
|
|
| client = OpenAI( |
| base_url="https://integrate.api.nvidia.com/v1", |
| api_key=os.getenv('API_KEY') |
| ) |
|
|
| def generate_response(message, history): |
| if history: |
| history_openai_format = history |
| else: |
| history_openai_format = [] |
|
|
| history_openai_format.append({"role": "user", "content": message}) |
|
|
| completion = client.chat.completions.create( |
| model="nvidia/nemotron-4-340b-instruct", |
| messages=history_openai_format, |
| temperature=0.2, |
| top_p=0.7, |
| max_tokens=1024, |
| stream=True |
| ) |
|
|
| response = "" |
| for chunk in completion: |
| if chunk.choices[0].delta.content is not None: |
| response += chunk.choices[0].delta.content |
|
|
| history_openai_format.append({"role": "assistant", "content": response}) |
| return response, history_openai_format |
|
|
| iface = gr.ChatInterface( |
| generate_response, |
| title="NVIDIA Nemotron-4 Sohbet Arayüzü", |
| description="Bir soru girin ve NVIDIA'nın Nemotron-4 modeli tarafından üretilen yanıtı alın. Sohbet geçmişi korunacaktır.", |
| examples=[ |
| "GPU hesaplamanın harikalarıyla ilgili bir limerick yazabilir misin?", |
| "Yapay zeka ve etik arasındaki ilişkiyi açıklayabilir misin?", |
| "Kuantum bilgisayarların geleceği hakkında ne düşünüyorsun?" |
| ], |
| cache_examples=False, |
| type='messages' |
| ) |
|
|
| iface.launch() |