Tehnične informacije o servisu STA
Možnosti dostopa do novic
Naročniki lahko novice STA dobijo na naslednje načine:
- preko spletnih strani,
- preko elektronske pošte,
- preko protokola FTP (file transfer protocol) in
- preko protokola HTTP (hyper-text transfer protocol).
Dostop preko spletnih strani
Za dostop preko spletnih strani vam dodelimo uporabniško ime in geslo. Do servisa se dostopa preko naslova www.sta.si.
Dostop preko elektronske pošte
Če želite novice dobivati po elektronski pošti, nam morate sporočiti le e-poštni naslov in želeni format (IPTC ali NewsML - sta opisana spodaj). Novice so v telesu sporočila (ne v priponki). Content-type je text/plain za novice v IPTC formatu oziroma text/xml za novice v formatu NewsML.
Pošiljatelj novic (vrstica From v glavi sporočila) je news-dispatch@sta.si.
Dostop preko protokola FTP
Za prenos novic po protokolu nam sporočite naslov vašega FTP strežnika, na katerem nam morate dodeliti uporabniško ime in geslo, na požarnem zidu dovoliti FTP povezave iz omrežij STA (213.250.35.96/27 in 212.18.47.64/27) in nam sporočiti, v katero mapo naj shranjujemo novice.
Imena datotek imajo obliko DDMM_UU-NNNN-KK.txt, kjer je UU uredništvo, DD dan, MM mesec, NNNN zaporedna številka novice, KK pa njena primarna kategorija (npr.: 1709_GO-0013-DZ.txt).
Dostop preko protokola HTTP
Običajen dostop preko spletnih strani, ki je omenjen zgoraj, je namenjen branju novic s pomočjo spletnega brskalnika. Format teh strani je HTML, ki je primeren za ogled, ni pa primeren za nadaljno računalniško obdelavo.
Pri dostopu preko protokola HTTP vam prav tako dodelimo uporabniško ime in geslo, novice pa pobirate s spletnega strežnika v formatih IPTC ali NewsML.
Do novic dostopate preko naslova http://www.sta.si/http.php. Če kličete ta naslov brez dodatnih argumentov, vam bo strežnik vrnil seznam novic, ki jih še niste prebrali. Če ste izbrali format IPTC, bo Content-type nastavljen na text/plain, v telesu pa bodo ID številke neprebranih novic - vsaka v svoji vrstici. Na primer:
1000145 1000146 1000152
Če ste izbrali format NewsML, bo Content-type nastavljen na text/xml, telo pa bo izgledalo takole:
<?xml version="1.0" encoding="iso-8859-2"?>
<NewsML>
<SpooledItems>
<SpooledItemId>100145</SpooledItemId>
<SpooledItemId>100146</SpooledItemId>
<SpooledItemId>100152</SpooledItemId>
</SpooledItems>
</NewsML>
Zgoraj omenjeni naslov lahko kličete tudi z argumentom "id=...". Na primer: http://www.sta.si/http.php?id=1000145. V tem primeru bo v telesu izbrana novica v želenem formatu (IPTC ali NewsML).
Ko novico enkrat preberete, ne bo več na voljo.
Kodne tabele
Novice lahko pošiljamo v kodnih tabelah:
- iso646-yu ("YU-ASCII", "SLO-ASCII", 7-bitna),
- iso-8859-2 (standard ISO Latin 2),
- utf-8 (Unicode) in
- windows-1250 (Microsoftova kodna tabela).
Opis formata IPTC
Novica v IPTC formatu:
^ASTA018 4 MP 0000 ZP EU VELIKA BRITANIJA/ŽIVALI ^BV Veliki Britaniji potrdili tretji primer parkljevke in slinavke pripravilo zunanjepolitično uredništvo STA= London, 23. februarja (STA/DPA/AFP) - V Veliki Britaniji so danes potrdili tretji primer obolelosti za parkljevko in slinavko in sicer znotraj varnostnega območja, ki so ga vzpostavili v sredo po odkritju prvega primera bolezni na neki prašičji farmi v grofiji Essex. Kmetijsko ministrstvo preučuje, ali bi morali to varnostno območje še razširiti. Posebni ukrepi veljajo za 600 kmetij v državi, okoli katerih je omejeno gibanje. Varnostno območje v premeru osmih kilometrov pa so vzpostavili tudi okoli neke prašičje farme v Northumberlandu zaradi suma, da bi med prašiči lahko bili tudi okuženi.*** Britanski kmetijski minister Nick Brown je danes pozval Britance k večji pazljivosti, da bi čimbolj zmanjšali nevarnost širjenja bolezni. Prebivalce mest blizu okuženih območij je pozval, naj se izogibajo potovanjem na deželo, v primeru potovanj pa naj uporabljajo le glavne prometnice. Pozval jih je tudi, naj se izogibajo stikom z živino in kmetijami, živinorejce pa k doslednemu izvajanju higienskih pravil. Slinavka in parkljevka je namreč hitro prenosljiva virusna bolezen prežvekovalcev in prašičev, ki sicer ni nevarna za človeka, zaradi hitrega širjenja med živalmi pa predstavlja ogromno gospodarsko grožnjo za kmetovalce. Prenaša se po zraku. Britanska vlada je v sredo, ko so po 20 letih znova odkrili primer bolezni slinavke in parkljevke, že začasno ustavila izvoz vsega britanskega mesa in živine ter mesnih izdelkov. Evropska komisija pa je isti dan do 1. marca prepovedala izvoz vse britanske živine, mesa, mesnih izdelkov, mleka in mlečnih izdelkov v druge države Evropske unije. O morebitnih nadaljnjih ukrepih se bo 27. februarja izrekel veterinarski odbor EU. (konec)vr/sk STA018 2001-02-23/12:18 ^C231218 FEB 2001 ^D
Prva vrstica (^ASTA018 4 MP 0000 ZP EU): prvi znak v vrstici je SOH (start of header, ASCII koda 1). Sledi niz STA in zaporedna številka novice (tri cifre). Za presledkom je vrsta novice (interen podatek, za katerega šifrant ni na voljo). Sledi koda kategorije (šifrant je spodaj), štiri ničle in koda uredništva (šifrant je spodaj). Novica ima lahko tudi sekundarno kategorijo (v tem primeru: EU), ki je v tem primeru napisana na koncu prve vrstice.
V drugi vrstici so s poševnico (/) ločene ključne besede.
Tretja vrstica se začne s STX (start of text, ASCII koda 2). Sledi ji naslov. Za naslovom je lahko enačaj - ta označuje konec glave novice. Lahko pa naslovu sledi prazna vrstica in za njo vrstica z uredniškimi opombami, ki se zaključi z enačajem.
Primer novice z uredniškimi opombami je v zgornji novici. Novica brez uredniških opomb bi izgledala takole:
^ASTA018 4 MP 0000 ZP EU VELIKA BRITANIJA/ŽIVALI ^BV Veliki Britaniji potrdili tretji primer parkljevke in slinavke= London, 23. februarja (STA/DPA/AFP) - V Veliki Britaniji so danes potrdili tretji primer obolelosti za parkljevko in slinavko in sicer ...
Naslovu (in morebitnim uredniškim opombam) sledi povzetek novice (lead), ki se začne z mesti, ločenimi s poševnicami (na primer: London/Pariz), datum, in v oklepaju agencije. Zaklepaju sledijo presledek, pomišljaj in še en presledek, sledi pa samo besedilo povzetka. Povzetek se zaključi s tremi zvezdicami (***).
Sledi besedilo novice, ki ima lahko več odstavkov. Kakšne zelo kratke novice besedila sploh nimajo, ker je vsa vsebina že v povzetku.
Novica se zaključi z besedo (konec), kateri sledijo avtorji in soavtorji novice, ločeni s poševnicami.
Naslednja vrstica se začne z nizom "STA", ki ji sledi zaporedna številka novice - ta je enaka, kot v prvi vrstici novice. Za presledkom je datum v obliki LLLL-MM-DD/hh:mm.
Naslednja vrstica se začne s ETX (end of text, ASCII koda 3), sledi datum objave v obliki DDhhmm MMM LLLL.
V zadnji vrstici je znak EOT (end of transmission, ASCII koda 4).
IPTC format lahko pošiljamo v naslednjih podvariantah:
- z lomljenjem vrstic ali brez - nekateri poštni programi (MTA - mail transfer agent) ne dovolijo e-sporočil, ki imajo vrstice daljše od 1024 znakov, zato dolge odstavke lomimo na vrstice, ki niso daljše od 76 znakov. Če novice prenašamo preko drugih protokolov, lom dolgih odstavkov ni potreben;
- s kontrolnimi znaki ali brez (SOH, STX, ETX in EOT).
Opis formata NewsML
Format NewsML je različica XML formata, ki jo je za potrebe agencij sprejel IPTC (International Press Telecommunications Council). Polna specifikacija formata je dostopna na spletnem naslovu www.newsml.org.
Novica STA v formatu NewsML izgleda takole:
<?xml version="1.0" encoding="iso-8859-2"?>
<NewsML>
<NewsEnvelope>
<TransmissionId>ZP0018MPs</TransmissionId>
<DateAndTime>20010223T1218</DateAndTime>
<Priority FormalName="4" Scheme="IptcPriority"/>
</NewsEnvelope>
<NewsItem>
<Identification>
<NewsIdentifier>
<ProviderId>sta.si</ProviderId>
<DateId>20010223</DateId>
<NewsItemId>ZP0018MPEU</NewsItemId>
</NewsIdentifier>
</Identification>
<NewsComponent>
<NewsLines>
<HeadLine>V Veliki Britaniji potrdili tretji primer
parkljevke in slinavke</HeadLine>
<SubHeadLine>pripravilo zunanjepolitično uredništvo
STA</SubHeadLine>
<ByLine>vr/sk</ByLine>
<DateLine>2001-02-23/12:18</DateLine>
<CopyrightLine>STA 2001</CopyrightLine>
<KeywordLine>VELIKA BRITANIJA/ŽIVALI</KeywordLine>
<NewsLine>
<NewsLineType FormalName="LEAD"/>
<NewsLineText>
<p>London, 23. februarja (STA/DPA/AFP) - V Veliki Britaniji so danes
potrdili tretji primer obolelosti za parkljevko in slinavko in sicer
znotraj varnostnega območja, ki so ga vzpostavili v sredo po
odkritju prvega primera bolezni na neki prašičji farmi v grofiji
Essex. Kmetijsko ministrstvo preučuje, ali bi morali to varnostno
območje še razširiti. Posebni ukrepi veljajo za 600 kmetij v državi,
okoli katerih je omejeno gibanje. Varnostno območje v premeru osmih
kilometrov pa so vzpostavili tudi okoli neke prašičje farme v
Northumberlandu zaradi suma, da bi med prašiči lahko bili tudi
okuženi.</p>
</NewsLineText>
</NewsLine>
<NewsLine>
<NewsLineType FormalName="TEXT"/>
<NewsLineText>
<p>Britanski kmetijski minister Nick Brown je danes pozval Britance k
večji pazljivosti, da bi čimbolj zmanjšali nevarnost širjenja
bolezni. Prebivalce mest blizu okuženih območij je pozval, naj se
izogibajo potovanjem na deželo, v primeru potovanj pa naj
uporabljajo le glavne prometnice. Pozval jih je tudi, naj se
izogibajo stikom z živino in kmetijami, živinorejce pa k doslednemu
izvajanju higienskih pravil. Slinavka in parkljevka je namreč hitro
prenosljiva virusna bolezen prežvekovalcev in prašičev, ki sicer ni
nevarna za človeka, zaradi hitrega širjenja med živalmi pa
predstavlja ogromno gospodarsko grožnjo za kmetovalce. Prenaša se po
zraku.</p>
<p>Britanska vlada je v sredo, ko so po 20 letih znova odkrili primer
bolezni slinavke in parkljevke, že začasno ustavila izvoz vsega
britanskega mesa in živine ter mesnih izdelkov. Evropska komisija pa
je isti dan do 1. marca prepovedala izvoz vse britanske živine,
mesa, mesnih izdelkov, mleka in mlečnih izdelkov v druge države
Evropske unije. O morebitnih nadaljnjih ukrepih se bo 27. februarja
izrekel veterinarski odbor EU.</p>
</NewsLineText>
</NewsLine>
</NewsLines>
</NewsComponent>
</NewsItem>
</NewsML>
Pregled elementov NewsMLa je v tabeli:
| TransmissionId | interna oznaka, naročnikov razčlenjevalnik naj ignorira |
| DateAndTime | datum in čas objave novice v obliki LLLLMMDDThhmm |
| Priority FormalName="..." Scheme="IptcPriority" | interna oznaka vrste novice |
| DateId | datum objave novice v obliki LLLLMMDD |
| NewsItemId | podatki o uredništvu (UU), zaporedni številki novice (NNNN), primarni kategoriji (11) in opcijsko sekundarni kategoriji (22) - format je UUNNNN11 ali UUNNNN1122 |
| HeadLine | naslov novice |
| SubHeadLine | uredniške opombe; tega elementa nimajo vse novice |
| ByLine | avtorji - interne oznake |
| DateLine | datum in čas objave novice v obliki LLLL-MM-DD/hh:mm |
| CopyrightLine | lastnik avtorskih pravic |
| KeywordLine | ključne besede, ki so med seboj ločene s poševnico |
| NewsLineType FormalName="LEAD" | povzetek (lead) novice; za podrobnejši opis povzetka preberite opis formata IPTC zgoraj; v formatu NewsML se povzetek ne zaključi s tremi zvezdicami |
| NewsLineType FormalName="TEXT" | besedilo novice |
Novice v formatu NewsML lahko pošiljamo z lomljenjem vrstic ali brez - nekateri poštni programi (MTA - mail transfer agent) ne dovolijo e-sporočil, ki imajo vrstice daljše od 1024 znakov, zato dolge odstavke lomimo na vrstice, ki niso daljše od 76 znakov. Če novice prenašamo preko drugih protokolov, lom dolgih odstavkov ni potreben.
Šifranti
Šifrant uredništev
| AN | English Service |
| BN | Bilten |
| EU | Uredništvo za evropske zadeve |
| GO | Gospodarsko uredništvo |
| KU | Kulturno uredništvo |
| NP | Notranjepolitično uredništvo |
| OI | Olimpijski servis |
| RA | STA-R |
| SP | Športno uredništvo |
| UR | Splošno uredništvo |
| ZP | Zunanjepolitično uredništvo |
Šifrant kategorij - splošni servis
| DZ | Državni zbor |
| EU | Evropska unija |
| GO | Slovensko gospodarstvo |
| GS | Gospodarstvo v svetu |
| KR | Kronika |
| KU | Kultura |
| MP | Mednarodna politika |
| NA | Napovedi dogodkov |
| NP | Slovenska notranja politika |
| OI | Olimpijske igre |
| PG | Pregledi dogodkov |
| PT | Pregled tiska |
| SI | Servisne informacije |
| SL | Slovenija |
| SO | Šolstvo |
| SP | Šport |
| SU | Sporočila uredništvom |
| SV | Svet |
| ZA | Zanimivosti |
| ZD | Zdravstvo |
| ZP | Slovenska zunanja politika |
| ZT | Znanost in tehnologija |
Šifrant kategorij - angleški servis
| AC | Arts and Culture |
| AD | Advisory |
| AS | Around Slovenia |
| BE | Business, Finance and Economy |
| HE | Health, environment, science |
| PO | Politics |
| RU | Roundup |
| SE | Schedule of Events |
| ST | Sports |


